進階網站索引會根據您匯入資料存放區的網路資料大小,產生每月資料儲存空間費用。如要在匯入網頁資料前估算資料大小,可以呼叫 estimateDataSize 方法,並指定要匯入的網頁。estimateDataSize 方法是「長時間執行的作業」,會持續執行,直到資料大小估算程序完成為止。視您指定的網頁數量而定,這項作業可能需要幾分鐘到超過一小時才能完成。估算完網頁資料大小後,您可以使用 Vertex AI Search 定價頁面 (請參閱「資料索引定價」一節) 或 Google Cloud 的定價計算機 (搜尋「Vertex AI Search」),估算每月資料儲存費用。
事前準備
匯入網站資料至資料儲存庫時,請決定要納入 (及選擇性排除) 的網站網址模式。呼叫 estimateDataSize 方法時,您會指定這些網址模式。
程序
如要估算網頁資料的大小,請按照下列步驟操作:
呼叫
estimateDataSize方法。curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \ -d '{ "website_data_source": { "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_INCLUDE", exact_match: EXACT_MATCH_BOOLEAN }, "estimator_uri_patterns": { provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE", exact_match: EXACT_MATCH_BOOLEAN, exclusive: EXCLUSIVE_BOOLEAN } } }'更改下列內容:
PROJECT_ID:專案 ID。URI_PATTERN_TO_INCLUDE:您想納入資料大小估算的網站網址模式。URI_PATTERN_TO_EXCLUDE:(選用) 要從資料大小預估值中排除的網站網址模式。對於
URI_PATTERN_TO_INCLUDE和URI_PATTERN_TO_EXCLUDE,您可以使用類似下列的模式:- 整個網站:
www.mysite.com - 網站的各個部分:
www.mysite.com/faq - 整個網域:
mysite.com或*.mysite.com
- 整個網站:
EXCLUSIVE_BOOLEAN:(選填) 如果是true,則提供的 URI 模式代表從資料大小預估值中排除的網頁。預設值為false,表示提供的 URI 模式代表納入資料大小估算的網頁。EXACT_MATCH_BOOLEAN:(選用) 如果是true,提供的 URI 模式代表單一網頁,而非網頁及其所有子項。預設值為false,表示提供的 URI 模式代表網頁及其所有子項。
輸出結果會與下列內容相似:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata" } }這項輸出內容包含
name欄位,也就是長時間執行的作業名稱。儲存name值,以供後續步驟使用。輪詢
operations.get方法。curl -X GET \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"將
OPERATION_NAME改為您在上一步儲存的name值。您也可以列出長時間執行的作業,以取得作業名稱。評估每則回覆。
如果回應不包含
"done": true,表示估算資料大小的程序尚未完成。繼續輪詢。輸出結果會與下列內容相似:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2025-10-29T21:59:59.976752Z" } }如果回應包含
"done": true,表示資料大小估算程序已完成。儲存回應中的DATA_SIZE_BYTES值,以供後續步驟使用。輸出結果會與下列內容相似:
{ "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata", "createTime": "2025-10-29T21:59:59.976752Z" }, "done": true, "response": { "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse", "dataSizeBytes": DATA_SIZE_BYTES, "documentCount": DOCUMENT_COUNT } }這項輸出內容包含下列值:
DATA_SIZE_BYTES:網頁資料的預估大小 (以位元組為單位)。DOCUMENT_COUNT:網頁資料中的網頁預估數量。
將上一個步驟中的
DATA_SIZE_BYTES值除以 1,000,000,000,即可取得 GB。請儲存這個值,以供後續步驟使用。如要估算每月資料儲存空間費用,請按照下列步驟操作:
按一下「新增至估算值」。
搜尋
Vertex AI Search,然後點選「Vertex AI Search」方塊。在「資料索引」方塊中,輸入上一步中估算的網頁資料大小 (以 GB 為單位)。
查看「預估費用」方塊,瞭解預估的資料儲存費用。