開始使用向量搜尋功能前,請先選擇嵌入模型、準備資料,並決定要使用的端點類型。本頁面提供相關資訊。
準備嵌入項目
如要使用 Vector Search,您必須先準備好嵌入項目。如果已有嵌入內容,請略過至選擇端點。
如要建立嵌入內容,請按照下列步驟操作:
選擇嵌入模型:有許多外部嵌入模型可供選擇,這些模型提供不同的功能。
Vector Search 支援稠密嵌入、稀疏嵌入和混合型搜尋。混合型搜尋會根據您為這些嵌入類型指定的權重,使用稠密和稀疏嵌入。
視用途而定,選擇下列其中一種模型:
可立即使用: 如果您想根據文字或圖片本身的關聯性,在語意上比對文字與文字或文字與圖片,這是標準用途,因此不必訓練或調整模型。文字嵌入是這個用途的建議選項。Agent Platform 使用密集嵌入模型。
嵌入的自訂模型:如要根據自己的資料或特定用途進行比對。
準備資料:清理及預先處理資料,確保資料格式符合嵌入模型需求。
使用自訂模型時,請訓練嵌入模型:如果您選擇使用自訂嵌入模型 (微調),則需要使用自己的資料訓練模型。視資料大小和複雜度而定,這項程序可能相當耗時。如果您使用Model Garden的預先訓練模型,則可以略過這個步驟。
生成嵌入:模型訓練完成後,即可用來生成資料的嵌入。
選擇端點
建立索引後,請將索引部署至端點。詳情請參閱「部署及管理公開索引端點」和「在虛擬私有雲網路中部署及管理索引端點」。建議您先決定需要哪種端點,再建立索引。
您可以將查詢索引部署至下列其中一項:
公開端點:如果部署至公開端點,就不需要設定網路。公用網路的延遲時間稍長,但設定速度較快,也較容易維護。
私人端點:如要使用虛擬私有雲,請先設定網路。向量搜尋支援兩種私有網路。
VPC 網路對等互連連線,可減少網路延遲。
Private Service Connect:在屬於不同群組、團隊、專案或機構的虛擬私有雲網路之間,以私密方式使用服務。
後續步驟
產生嵌入內容並決定要部署索引的位置後,下一步就是設定索引。