本頁說明如何使用 Vertex AI Search 的資料,建立回覆基準。
根據您的資料建立 Gemini 基準
如要執行檢索增強生成 (RAG),請將模型連結至網站資料或文件集,然後使用 Vertex AI Search 建立基準。
以自有資料建立基準最多支援 10 個 Vertex AI Search 資料來源,且可與利用 Google 搜尋建立基準搭配使用。
支援的模型
本節列出支援以資料為基礎的基礎模型。
- Gemini 3 Pro 預先發布版模型
- Gemini 3 Pro Image 預先發布版模型
- Gemini 2.5 Pro
- Gemini 2.5 Flash 預先發布版模型
- Gemini 2.5 Flash-Lite 預先發布版模型
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Flash (支援 Live API 原生音訊) 預先發布版模型
- Gemini 2.0 Flash with Live API Preview model
- Gemini 2.0 Flash
必要條件
如要使用自有資料做為模型輸出內容的基準,請先完成下列步驟:
前往 Google Cloud 控制台的「IAM」頁面,然後搜尋
discoveryengine.servingConfigs.search權限,這是基礎服務運作的必要權限。啟用 AI Applications 並啟動 API。
建立 AI 應用程式資料來源和應用程式。
詳情請參閱 Vertex AI Search 簡介。
啟用 AI Applications
如要使用 Vertex AI Search 建立回覆基準,請按照下列步驟啟用 Vertex AI Search 服務:
前往 Google Cloud 控制台的「AI Applications」頁面。
選用:查看資料使用條款。
AI Applications 適用於 global 地區,或 eu 和 us 多地區。詳情請參閱「AI Applications 地區」。
在 AI Applications 中建立資料儲存庫
如要在 AI 應用程式中建立資料儲存庫,您可以選擇以網站資料或文件做為回覆基準。
網站
在「網站內容」方塊中,按一下「選取」。
系統會顯示「為資料儲存庫指定網站」窗格。如果「進階網站索引建立功能」未勾選,請選取「進階網站索引建立功能」核取方塊,將其開啟。
「設定資料儲存庫」窗格隨即顯示。在「指定要建立索引的網址模式」部分,執行下列操作:
- 新增「要包含的網站」網址。
- 選用:新增要排除的網站網址。
按一下「繼續」。
在「設定資料儲存庫」窗格中,
- 從「資料儲存庫位置」清單中選取值。
- 在「Your data store name」(資料儲存庫名稱) 欄位中輸入名稱。系統會產生 ID。使用資料儲存庫生成有憑有據的回覆時,請使用這個 ID。詳情請參閱「使用資料存放區產生有根據的回覆」。
- 點選「建立」。
文件
在「Cloud Storage」方塊中,按一下「選取」。
「從 Cloud Storage 匯入資料」窗格隨即顯示。在「非結構化文件 (PDF、HTML 和 TXT 等)」部分,選取「非結構化文件 (PDF、HTML 和 TXT 等)」。
選取「同步處理頻率」選項。
選取「Select a folder or a file you want to import」(選取要匯入的資料夾或檔案) 選項,然後在欄位中輸入路徑。
按一下「繼續」。系統會顯示「設定資料儲存庫」窗格。
在「設定資料儲存庫」窗格中,
- 從「資料儲存庫位置」清單中選取值。
- 在「Your data store name」(資料儲存庫名稱) 欄位中輸入名稱。系統會產生 ID。
- 如要為文件選取剖析和分塊選項,請展開「文件處理選項」部分。如要進一步瞭解不同剖析器,請參閱「剖析文件」。
- 點選「建立」。
點選「建立」。
使用資料儲存庫生成有憑有據的回覆
請按照下列操作說明,使用資料做為模型基礎。最多支援 10 個資料儲存區。
如果不知道資料儲存庫 ID,請按照下列步驟操作:
前往 Google Cloud 控制台的「AI Applications」頁面,然後點按導覽選單中的「Data Stores」(資料儲存庫)。
點按資料儲存庫的名稱。
在資料儲存庫的「資料」頁面中,取得資料儲存庫 ID。
控制台
如要使用Google Cloud 控制台中的 Vertex AI Studio,根據 AI 應用程式調整模型輸出內容,請按照下列步驟操作:
- 前往 Google Cloud 控制台的「Vertex AI Studio」頁面。
- 如要啟用接地功能,請按照下列步驟操作:
- 按一下導覽選單中的「+ 新增」和「即時通訊」。
- 展開「模型設定」窗格,然後選取模型。
- 選用:如果「結構化輸出」或「基礎: Google」切換鈕已開啟,請關閉該選項。
- 按一下「建立基準:您的資料」切換鈕。「自訂依據設定」窗格隨即顯示。
- 從下表選取依據來源選項:
- 在「Elasticsearch 端點」欄位中輸入值。
- 在「Elasticsearch API 金鑰」欄位中輸入值。
- 在「Elasticsearch index」(Elasticsearch 索引) 欄位中輸入值。
- 在「Elasticsearch 搜尋範本」欄位中輸入值。
- 按一下 [儲存]。
接地選項 說明 輸入內容 Vertex AI RAG 引擎 以您的資料和 DIY 元件建立基準。 如果沒有語料庫,請先建立一個。否則請輸入語料庫。 Vertex AI Search 使用 Google代管搜尋引擎,以您的資料建立基準。 在「Vertex AI 資料儲存庫路徑」欄位中輸入路徑。 Elasticsearch 使用 Elasticsearch 建立基準。 輸入下列資訊:
- 在文字方塊中輸入提示詞,然後按一下「提交」。提示回覆內容是以 AI 應用程式為依據。
Python
安裝
pip install --upgrade google-genai
詳情請參閱 SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
from google import genai
from google.genai.types import (
GenerateContentConfig,
VertexAISearch,
Retrieval,
Tool,
HttpOptions,
)
client = genai.Client(http_options=HttpOptions(api_version="v1"))
# Replace with your Vertex AI Search data store details
DATASTORE_PATH = "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATASTORE_ID"
tool = Tool(
retrieval=Retrieval(
vertex_ai_search=VertexAISearch(
datastore=DATASTORE_PATH
)
)
)
response = client.models.generate_content(
model="gemini-2.5-flash", # Or another supported model
contents="What information can you find about topic X in the provided documents?", # Your query
config=GenerateContentConfig(
tools=[tool],
),
)
print(response.text)
REST
如要使用 Vertex AI API 測試文字提示,請將 POST 要求傳送至發布商模型端點。
使用任何要求資料之前,請先替換以下項目:
- LOCATION:處理要求的區域。如要使用
global端點,請從端點名稱中排除位置,並將資源位置設為global。 - PROJECT_ID:您的專案 ID。
- MODEL_ID:多模態模型的模型 ID。
- PROMPT:要傳送給模型的提示。
HTTP 方法和網址:
POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
JSON 要求主體:
{
"contents": [{
"role": "user",
"parts": [{
"text": "PROMPT"
}]
}],
"tools": [{
"retrieval": {
"vertexAiSearch": {
"datastore": projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATASTORE_ID
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
請展開以下其中一個選項,以傳送要求:
您應該會收到如下的 JSON 回覆:
{
"candidates": [
{
"content": {
"role": "model",
"parts": [
{
"text": "You can make an appointment on the website https://dmv.gov/"
}
]
},
"finishReason": "STOP",
"safetyRatings": [
"..."
],
"groundingMetadata": {
"retrievalQueries": [
"How to make appointment to renew driving license?"
],
"groundingChunks": [
{
"retrievedContext": {
"uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/AXiHM.....QTN92V5ePQ==",
"title": "dmv"
}
}
],
"groundingSupport": [
{
"segment": {
"startIndex": 25,
"endIndex": 147
},
"segment_text": "ipsum lorem ...",
"supportChunkIndices": [1, 2],
"confidenceScore": [0.9541752, 0.97726375]
},
{
"segment": {
"startIndex": 294,
"endIndex": 439
},
"segment_text": "ipsum lorem ...",
"supportChunkIndices": [1],
"confidenceScore": [0.9541752, 0.9325467]
}
]
}
}
],
"usageMetadata": {
"..."
}
}
瞭解回覆內容
這兩個 API 的回覆都會包含 LLM 生成的文字,稱為「候選項目」。如果模型提示成功以資料來源為依據,回應就會包含依據中繼資料,指出回應中衍生自資料的部分。不過,這類中繼資料可能因多種原因而未提供,導致提示回應未根據中繼資料生成。包括來源關聯性低,或是模型回覆中資訊不完整。
輸出資料的細目如下:
- 角色:指出已建立基準答案的傳送者。由於回覆一律包含有根據的文字,因此角色一律為
model。 - 文字:LLM 生成的依據資料答案。
- 建立基準中繼資料:建立基準來源的相關資訊,包含下列元素:
- 基礎塊:索引中的結果清單,可支援答案。
- 建立基準支援:答案中特定主張的相關資訊,可用於顯示引文:
- 區段:模型回覆中由基礎事實塊佐證的部分。
- 基礎事實區塊索引:基礎事實區塊清單中的基礎事實區塊索引,對應至這項聲明。
- 信心分數:介於 0 到 1 之間的數字,表示聲明在所提供的基礎區塊集中有多可靠。不適用於 Gemini 2.5 以上版本。