事前準備

開始使用向量搜尋功能前,請先選擇嵌入模型、準備資料,並決定要使用的端點類型。本頁面提供相關資訊。

準備嵌入項目

如要使用 Vector Search,您必須先準備好嵌入項目。如果已有嵌入內容,請略過至選擇端點

如要建立嵌入內容,請按照下列步驟操作:

  1. 選擇嵌入模型:有許多外部嵌入模型可供選擇,這些模型提供不同的功能。

    Vector Search 支援稠密嵌入、稀疏嵌入和混合型搜尋。混合型搜尋會根據您為這些嵌入類型指定的權重,使用稠密和稀疏嵌入。

    視用途而定,選擇下列其中一種模型:

    • 可立即使用: 如果您想根據文字或圖片本身的關聯性,在語意上比對文字與文字或文字與圖片,這是標準用途,因此不必訓練或調整模型。文字嵌入是這個用途的建議選項。Agent Platform 使用密集嵌入模型。

    • 嵌入的自訂模型:如要根據自己的資料或特定用途進行比對。

  2. 準備資料:清理及預先處理資料,確保資料格式符合嵌入模型需求。

  3. 使用自訂模型時,請訓練嵌入模型:如果您選擇使用自訂嵌入模型 (微調),則需要使用自己的資料訓練模型。視資料大小和複雜度而定,這項程序可能相當耗時。如果您使用Model Garden的預先訓練模型,則可以略過這個步驟。

  4. 生成嵌入:模型訓練完成後,即可用來生成資料的嵌入。

選擇端點

建立索引後,請將索引部署至端點。詳情請參閱「部署及管理公開索引端點」和「在虛擬私有雲網路中部署及管理索引端點」。建議您先決定需要哪種端點,再建立索引。

您可以將查詢索引部署至下列其中一項:

  • 公開端點:如果部署至公開端點,就不需要設定網路。公用網路的延遲時間稍長,但設定速度較快,也較容易維護。

  • 私人端點:如要使用虛擬私有雲,請先設定網路。向量搜尋支援兩種私有網路。

後續步驟

產生嵌入內容並決定要部署索引的位置後,下一步就是設定索引。