估算每月存储费用

高级网站编入索引功能会产生每月数据 存储费用,具体取决于您导入到数据 存储区中的网络数据的大小。如需在导入网络数据之前估算其大小,您可以 调用 estimateDataSize 方法并指定要导入的网络 网页。estimateDataSize 方法是一种 长时间运行 操作,它会一直运行,直到估算 数据大小的过程完成为止。根据您指定的网页数量,此过程可能需要几分钟到一小时以上的时间。在估算出网络数据的大小后,您可以使用 Agent Search 价格页面(请参阅数据索引 价格部分)或 Google Cloud's pricing calculator(搜索 Agent Search)来估算每月数据存储费用。

准备工作

确定您在将网络数据导入到数据存储区时打算包含(并可以选择排除)的网站的网址格式。您可以在调用 estimateDataSize 方法时指定这些网址格式。

过程

如需估算网络数据的大小,请按以下步骤操作:

  1. 调用 estimateDataSize 方法。

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global:estimateDataSize" \
    -d '{
      "website_data_source": {
        "estimator_uri_patterns": {
          provided_uri_pattern: "URI_PATTERN_TO_INCLUDE",
          exact_match: EXACT_MATCH_BOOLEAN
        },
        "estimator_uri_patterns": {
          provided_uri_pattern: "URI_PATTERN_TO_EXCLUDE",
          exact_match: EXACT_MATCH_BOOLEAN,
          exclusive: EXCLUSIVE_BOOLEAN
        }
      }
    }'
    

    替换以下内容:

    • PROJECT_ID:您的项目的 ID。

    • URI_PATTERN_TO_INCLUDE:您希望在数据大小估算中包含的网站的网址格式。

    • URI_PATTERN_TO_EXCLUDE:(可选)您希望在数据大小估算中排除的网站的网址格式。

      对于 URI_PATTERN_TO_INCLUDEURI_PATTERN_TO_EXCLUDE,您可以使用类似于以下内容的格式:

      • 整个网站:www.mysite.com
      • 网站的部分内容:www.mysite.com/faq
      • 整个网域:mysite.com*.mysite.com
    • EXCLUSIVE_BOOLEAN:(可选)如果为 true,则提供的 URI 格式表示在数据大小估算中排除的网页。默认值为 false,这意味着提供的 URI 格式表示在数据大小估算中包含的网页。

    • EXACT_MATCH_BOOLEAN:(可选)如果为 true,则提供的 URI 格式表示单个网页,而不是网页及其所有子网页。默认值为 false,这意味着提供的 URI 格式表示网页及其所有子网页。

    输出类似于以下内容:

    {
      "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
      "metadata": {
        "@type":  "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata"
      }
    }
    

    此输出包含 name 字段,该字段是长时间运行的操作的名称。保存 name 值,以便在下一步中使用。

  2. 轮询 operations.get 方法。

    curl -X GET \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://discoveryengine.googleapis.com/v1/OPERATION_NAME"
    

    OPERATION_NAME 替换为您在上一步中保存的 name 值。您还可以通过列出长时间运行的操作来获取操作名称。

  3. 评估每个响应。

    • 如果响应不包含 "done": true,则表示 估算数据大小的过程尚未完成。继续轮询。

      输出类似于以下内容:

      {
        "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
        "metadata": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata",
          "createTime": "2025-10-29T21:59:59.976752Z"
        }
      }
      
    • 如果响应包含 "done": true,则表示估算 数据大小的过程已完成。保存响应中的 DATA_SIZE_BYTES 值,以便在下一步中使用。

      输出类似于以下内容:

      {
        "name": "projects/PROJECT_ID/locations/global/operations/estimate-data-size-01234567890123456789",
        "metadata": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeMetadata",
          "createTime": "2025-10-29T21:59:59.976752Z"
        },
        "done": true,
        "response": {
          "@type": "type.googleapis.com/google.cloud.discoveryengine.v1alpha.EstimateDataSizeResponse",
          "dataSizeBytes": DATA_SIZE_BYTES,
          "documentCount": DOCUMENT_COUNT
        }
      }
      

      此输出包括以下值:

      • DATA_SIZE_BYTES:网络数据的估计大小(以字节为单位)。

      • DOCUMENT_COUNT:网络数据中网页的估计数量。

  4. 将上一步中的 DATA_SIZE_BYTES 值除以 1,000,000,000,以获取千兆字节。保存此值以供下一步使用。

  5. 如需估算每月数据存储费用,请执行以下操作:

    1. 前往 Google Cloud 的价格计算器

    2. 点击添加到估算

    3. 搜索 Agent Search,然后点击 Agent Search 框。

    4. 数据索引 框中,输入上一步中估算的网络数据大小(以千兆字节为单位)。

      请参阅估计费用 框,了解您的估计数据存储费用。