開始使用向量搜尋功能前,請先選擇嵌入模型、準備資料,並決定要使用的端點類型。本頁面提供相關資訊。
準備嵌入項目
如要使用 Vector Search,您必須先準備好嵌入。如果已有嵌入內容,請跳至「選擇端點」。
如要建立嵌入內容,請按照下列步驟操作:
選擇嵌入模型:市面上有許多外部嵌入模型,提供不同的功能。
向量搜尋支援稠密嵌入、稀疏嵌入和混合型搜尋。混合型搜尋會根據您為這些嵌入類型指定的權重,使用稠密和稀疏嵌入。
視用途而定,選擇下列其中一種模型:
可立即使用: 如果您想根據文字或圖片本身的相關性,在語意上比對文字與文字,或是文字與圖片,這是標準用途,因此不必訓練或調整模型。文字嵌入是這個用途的建議選項。Agent Platform 使用密集嵌入模型。
自訂嵌入模型:如要根據自己的資料或特定用途進行比對。
準備資料:清理及預先處理資料,確保資料格式符合嵌入模型需求。
訓練嵌入模型 (如使用自訂模型):如果選擇使用自訂嵌入模型 (微調),則需要使用資料訓練模型。這項程序可能相當耗時,具體時間取決於資料的大小和複雜程度。如果使用 Model Garden 的預先訓練模型,則可以略過這個步驟。
生成嵌入:模型訓練完成後,即可用來為資料生成嵌入。
選擇端點
建立索引後,請將索引部署至端點。詳情請參閱「部署及管理公開索引端點」和「在虛擬私有雲網路中部署及管理索引端點」。建議您先決定需要哪種端點,再建立索引。
您可以將查詢索引部署至下列其中一項:
公開端點:如果部署至公開端點,就不需要設定網路。公用網路的延遲時間稍長,但設定速度較快,也較容易維護。
私人端點:如要使用虛擬私有雲,請先設定網路。向量搜尋支援兩種私有網路。
VPC 網路對等互連連線,可減少網路延遲。
Private Service Connect:在屬於不同群組、團隊、專案或機構的虛擬私有雲網路之間,以私密方式使用服務。
後續步驟
產生嵌入內容並決定要將索引部署到何處後,下一步就是設定索引。