将索引部署到端点包括以下三项任务:
- 创建
IndexEndpoint(如有需要)或重复使用现有的IndexEndpoint。 - 获取
IndexEndpointID。 - 将索引部署到
IndexEndpoint。
在 VPC 网络中创建 IndexEndpoint
如果要将 Index 部署到现有 IndexEndpoint,则可以跳过此步骤。
在使用索引响应在线向量匹配查询之前,您必须将 Index 部署到 VPC 网络对等互连网络中的 IndexEndpoint。第一步是创建 IndexEndpoint。您可以将多个索引部署到共享同一 VPC 网络的 IndexEndpoint。
gcloud
以下示例使用 gcloud ai index-endpoints create 命令。
在使用下面的命令数据之前,请先进行以下替换:
- INDEX_ENDPOINT_NAME:索引端点的显示名称。
- VPC_NETWORK_NAME:索引端点应与之建立对等互连的 Google Compute Engine 网络的名称。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud ai index-endpoints create \ --display-name=INDEX_ENDPOINT_NAME \ --network=VPC_NETWORK_NAME \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints create ` --display-name=INDEX_ENDPOINT_NAME ` --network=VPC_NETWORK_NAME ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints create ^ --display-name=INDEX_ENDPOINT_NAME ^ --network=VPC_NETWORK_NAME ^ --region=LOCATION ^ --project=PROJECT_ID
您应该会收到类似如下所示的响应:
The Google Cloud CLI tool might take a few minutes to create the IndexEndpoint.
REST
在使用任何请求数据之前,请先进行以下替换:
- INDEX_ENDPOINT_NAME:索引端点的显示名称。
- VPC_NETWORK_NAME:索引端点应与之建立对等互连的 Google Compute Engine 网络的名称。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROJECT_NUMBER:自动生成的项目编号。
HTTP 方法和网址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints
请求 JSON 正文:
{
"display_name": "INDEX_ENDPOINT_NAME",
"network": "VPC_NETWORK_NAME"
}
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.aiplatform.v1.CreateIndexEndpointOperationMetadata",
"genericMetadata": {
"createTime": "2022-01-13T04:09:56.641107Z",
"updateTime": "2022-01-13T04:09:56.641107Z"
}
}
}
您可以轮询操作状态,直到响应包含 "done": true。
Terraform
以下示例使用 vertex_ai_index_endpoint Terraform 资源创建索引端点。
如需了解如何应用或移除 Terraform 配置,请参阅基本 Terraform 命令。
Python
如需了解如何安装或更新 Vertex AI SDK for Python,请参阅安装 Vertex AI SDK for Python。 如需了解详情,请参阅 Python API 参考文档。
控制台
按照以下说明创建索引端点。
- 在 Google Cloud 控制台的 Vertex AI 部分中,前往部署和使用部分。选择 Vector Search。
- 系统会显示活跃索引列表。
- 选择页面顶部的索引端点标签页。系统会显示索引端点。
- 点击 创建新的索引端点。系统会打开“创建新的索引端点”面板。
- 输入索引端点的显示名称。
- 在区域字段中,从下拉列表选择一个区域。
- 在访问权限字段中,选择专用。
- 输入对等互连 VPC 网络详情。输入作业应对等互连的 Compute Engine 网络的全名。格式应为
projects/{project_num}/global/networks/{network_id} - 点击创建。
部署索引
gcloud
本示例使用 gcloud ai index-endpoints deploy-index 命令。
在使用下面的命令数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- DEPLOYED_INDEX_ID:用户指定的字符串,用于唯一标识已部署的索引。必须以字母开头,并且只包含字母、数字或下划线。如需了解格式准则,请参阅 DeployedIndex.id。
- DEPLOYED_INDEX_ENDPOINT_NAME:已部署索引端点的显示名称。
- INDEX_ID:索引的 ID。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --display-name=DEPLOYED_INDEX_ENDPOINT_NAME \ --index=INDEX_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --display-name=DEPLOYED_INDEX_ENDPOINT_NAME ` --index=INDEX_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --display-name=DEPLOYED_INDEX_ENDPOINT_NAME ^ --index=INDEX_ID ^ --region=LOCATION ^ --project=PROJECT_ID
您应该会收到类似如下所示的响应:
The Google Cloud CLI tool might take a few minutes to create the IndexEndpoint.
REST
在使用任何请求数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- DEPLOYED_INDEX_ID:用户指定的字符串,用于唯一标识已部署的索引。必须以字母开头,并且只包含字母、数字或下划线。如需了解格式准则,请参阅 DeployedIndex.id。
- DEPLOYED_INDEX_ENDPOINT_NAME:已部署索引端点的显示名称。
- INDEX_ID:索引的 ID。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROJECT_NUMBER:自动生成的项目编号。
HTTP 方法和网址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:deployIndex
请求 JSON 正文:
{
"deployedIndex": {
"id": "DEPLOYED_INDEX_ID",
"index": "projects/PROJECT_ID/locations/LOCATION/indexes/INDEX_ID",
"displayName": "DEPLOYED_INDEX_ENDPOINT_NAME"
}
}
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata",
"genericMetadata": {
"createTime": "2022-10-19T17:53:16.502088Z",
"updateTime": "2022-10-19T17:53:16.502088Z"
},
"deployedIndexId": "DEPLOYED_INDEX_ID"
}
}
Terraform
以下示例使用 vertex_ai_index_endpoint_deployed_index Terraform 资源创建所部署的索引端点。
如需了解如何应用或移除 Terraform 配置,请参阅基本 Terraform 命令。
Python
如需了解如何安装或更新 Vertex AI SDK for Python,请参阅安装 Vertex AI SDK for Python。 如需了解详情,请参阅 Python API 参考文档。
控制台
按照以下说明将索引部署到端点。
- 在 Google Cloud 控制台的 Vertex AI 部分中,前往部署和使用部分。选择 Vector Search。
- 系统会显示活跃索引列表。
- 选择您要部署的索引的名称。系统会打开索引详情页面。
- 在索引详情页面中,点击 部署到端点。系统会打开索引部署面板。
- 输入显示名称,此名称充当 ID 且无法更新。
- 从端点下拉列表中,选择要将此索引部署到的端点。注意:如果索引已部署到该端点,则该端点不可用。
- 可选:在机器类型字段中,选择标准内存或高内存。
- 可选。选择启用自动扩缩功能,以根据工作负载的需求自动调整节点数量。如果停用自动扩缩,则默认副本数为 2。
- 点击部署以将索引部署到端点。注意:部署过程大约需要 30 分钟。
启用自动扩缩功能
Vector Search 支持自动扩缩,该功能可以根据工作负载的需求自动调整节点数量。当需求较高时,节点会被添加到节点池(不会超过您指定的大小上限)。当需求较低时,节点池会缩减到您指定的最小大小。您可以通过监控当前副本来检查使用中的实际节点和更改。
如需启用自动扩缩功能,请在部署索引时指定 maxReplicaCount 和 minReplicaCount:
gcloud
以下示例使用 gcloud ai index-endpoints deploy-index 命令。
在使用下面的命令数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- DEPLOYED_INDEX_ID:用户指定的字符串,用于唯一标识已部署的索引。必须以字母开头,并且只包含字母、数字或下划线。如需了解格式准则,请参阅 DeployedIndex.id。
- DEPLOYED_INDEX_NAME:已部署索引的显示名称。
- INDEX_ID:索引的 ID。
- MIN_REPLICA_COUNT:始终在其中部署已部署索引的机器副本的数量下限。如果指定,则此值必须等于或大于 1。
- MAX_REPLICA_COUNT:可以在其中部署已部署索引的机器副本的数量上限。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --display-name=DEPLOYED_INDEX_NAME \ --index=INDEX_ID \ --min-replica-count=MIN_REPLICA_COUNT \ --max-replica-count=MAX_REPLICA_COUNT \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --display-name=DEPLOYED_INDEX_NAME ` --index=INDEX_ID ` --min-replica-count=MIN_REPLICA_COUNT ` --max-replica-count=MAX_REPLICA_COUNT ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --display-name=DEPLOYED_INDEX_NAME ^ --index=INDEX_ID ^ --min-replica-count=MIN_REPLICA_COUNT ^ --max-replica-count=MAX_REPLICA_COUNT ^ --region=LOCATION ^ --project=PROJECT_ID
REST
在使用任何请求数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- DEPLOYED_INDEX_ID:用户指定的字符串,用于唯一标识已部署的索引。必须以字母开头,并且只包含字母、数字或下划线。如需了解格式准则,请参阅 DeployedIndex.id。
- DEPLOYED_INDEX_NAME:已部署索引的显示名称。
- INDEX_ID:索引的 ID。
- MIN_REPLICA_COUNT:始终在其中部署已部署索引的机器副本的数量下限。如果指定,则此值必须等于或大于 1。
- MAX_REPLICA_COUNT:可以在其中部署已部署索引的机器副本的数量上限。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROJECT_NUMBER:自动生成的项目编号。
HTTP 方法和网址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:deployIndex
请求 JSON 正文:
{
"deployedIndex": {
"id": "DEPLOYED_INDEX_ID",
"index": "projects/PROJECT_NUMBER/locations/LOCATION/indexes/INDEX_ID",
"displayName": "DEPLOYED_INDEX_NAME",
"automaticResources": {
"minReplicaCount": MIN_REPLICA_COUNT,
"maxReplicaCount": MAX_REPLICA_COUNT
}
}
}
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata",
"genericMetadata": {
"createTime": "2023-10-19T17:53:16.502088Z",
"updateTime": "2023-10-19T17:53:16.502088Z"
},
"deployedIndexId": "DEPLOYED_INDEX_ID"
}
}
Python
如需了解如何安装或更新 Vertex AI SDK for Python,请参阅安装 Vertex AI SDK for Python。 如需了解详情,请参阅 Python API 参考文档。
控制台
您只能在索引部署期间从控制台启用自动扩缩。
- 在 Google Cloud 控制台的 Vertex AI 部分中,前往部署和使用部分。选择 Vector Search。
- 系统会显示活跃索引列表。
- 选择您要部署的索引的名称。系统会打开索引详情页面。
- 在索引详情页面中,点击 部署到端点。系统会打开索引部署面板。
- 输入显示名称,此名称充当 ID 且无法更新。
- 从端点下拉列表中,选择要将此索引部署到的端点。注意:如果索引已部署到该端点,则该端点不可用。
- 可选:在机器类型字段中,选择标准内存或高内存。
- 可选。选择启用自动扩缩功能,以根据工作负载的需求自动调整节点数量。如果停用自动扩缩,则默认副本数为 2。
- 如果
minReplicaCount和maxReplicaCount均未设置,则默认设置为 2。 - 如果仅设置了
maxReplicaCount,则minReplicaCount默认设置为 2。 - 如果仅设置了
minReplicaCount,则maxReplicaCount设置为等于minReplicaCount。
更改 DeployedIndex
您可以使用 MutateDeployedIndex API 更新已部署索引的部署资源(例如 minReplicaCount 和 maxReplicaCount)。
- 部署索引后,用户无法更改
machineType。 - 如果请求中未指定
maxReplicaCount,则DeployedIndex将继续使用现有的maxReplicaCount。
gcloud
以下示例使用 gcloud ai index-endpoints mutate-deployed-index 命令。
在使用下面的命令数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- DEPLOYED_INDEX_ID:用户指定的字符串,用于唯一标识已部署的索引。必须以字母开头,并且只包含字母、数字或下划线。如需了解格式准则,请参阅 DeployedIndex.id。
- MIN_REPLICA_COUNT:始终在其中部署已部署索引的机器副本的数量下限。如果指定,则此值必须等于或大于 1。
- MAX_REPLICA_COUNT:可以在其中部署已部署索引的机器副本的数量上限。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --min-replica-count=MIN_REPLICA_COUNT \ --max-replica-count=MAX_REPLICA_COUNT \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --min-replica-count=MIN_REPLICA_COUNT ` --max-replica-count=MAX_REPLICA_COUNT ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --min-replica-count=MIN_REPLICA_COUNT ^ --max-replica-count=MAX_REPLICA_COUNT ^ --region=LOCATION ^ --project=PROJECT_ID
REST
在使用任何请求数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- DEPLOYED_INDEX_ID:用户指定的字符串,用于唯一标识已部署的索引。必须以字母开头,并且只包含字母、数字或下划线。如需了解格式准则,请参阅 DeployedIndex.id。
- MIN_REPLICA_COUNT:始终在其中部署已部署索引的机器副本的数量下限。如果指定,则此值必须等于或大于 1。
- MAX_REPLICA_COUNT:可以在其中部署已部署索引的机器副本的数量上限。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROJECT_NUMBER:自动生成的项目编号。
HTTP 方法和网址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:mutateDeployedIndex
请求 JSON 正文:
{
"deployedIndex": {
"id": "DEPLOYED_INDEX_ID",
"index": "projects/PROJECT_ID/locations/LOCATION/indexes/INDEX_ID",
"displayName": "DEPLOYED_INDEX_NAME",
"min_replica_count": "MIN_REPLICA_COUNT",
"max_replica_count": "MAX_REPLICA_COUNT"
}
}
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata",
"genericMetadata": {
"createTime": "2020-10-19T17:53:16.502088Z",
"updateTime": "2020-10-19T17:53:16.502088Z"
},
"deployedIndexId": "DEPLOYED_INDEX_ID"
}
}
Terraform
如需了解如何应用或移除 Terraform 配置,请参阅基本 Terraform 命令。 如需了解详情,请参阅 Terraform 提供程序参考文档。
Python
如需了解如何安装或更新 Vertex AI SDK for Python,请参阅安装 Vertex AI SDK for Python。 如需了解详情,请参阅 Python API 参考文档。
影响性能的部署设置
使用 Vector Search 时,以下部署设置可能会影响延迟时间、可用性和费用。本指南适用于大多数情况。但是,请始终对您的配置进行实验,以确保它们适用于您的应用场景。
| 设置 | 性能影响 |
|---|---|
| 机器类型 |
硬件选择会与所选的分片大小直接相互作用。根据您在创建索引时指定的分片选项,每种机器类型都会在性能和费用之间折衷。 如需确定可用的硬件和价格,请参阅价格页面。一般来说,性能从低到高排列如下:
|
| 副本数下限 |
如果您的工作负载的模式是流量下降到较低水平,然后快速增长,请考虑将 |
| 副本数上限 |
maxReplicaCount 主要可让您控制使用费。您可以选择防止费用超过特定阈值,但代价是延迟时间增加和可用性降低。 |
列出 IndexEndpoints
如需列出 IndexEndpoint 资源并查看任何关联的 DeployedIndex 实例的信息,请运行以下代码:
gcloud
以下示例使用 gcloud ai index-endpoints list 命令。
在使用下面的命令数据之前,请先进行以下替换:
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud ai index-endpoints list \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints list ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints list ^ --region=LOCATION ^ --project=PROJECT_ID
REST
在使用任何请求数据之前,请先进行以下替换:
HTTP 方法和网址:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应:
{
"indexEndpoints": [
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID",
"displayName": "INDEX_ENDPOINT_DISPLAY_NAME",
"deployedIndexes": [
{
"id": "DEPLOYED_INDEX_ID",
"index": "projects/PROJECT_NUMBER/locations/LOCATION/indexes/INDEX_ID",
"displayName": "DEPLOYED_INDEX_DISPLAY_NAME",
"createTime": "2021-06-04T02:23:40.178286Z",
"privateEndpoints": {
"matchGrpcAddress": "GRPC_ADDRESS"
},
"indexSyncTime": "2022-01-13T04:22:00.151916Z",
"automaticResources": {
"minReplicaCount": 2,
"maxReplicaCount": 10
}
}
],
"etag": "AMEw9yP367UitPkLo-khZ1OQvqIK8Q0vLAzZVF7QjdZ5O3l7Zow-mzBo2l6xmiuuMljV",
"createTime": "2021-03-17T04:47:28.460373Z",
"updateTime": "2021-06-04T02:23:40.930513Z",
"network": "VPC_NETWORK_NAME"
}
]
}
Python
如需了解如何安装或更新 Vertex AI SDK for Python,请参阅安装 Vertex AI SDK for Python。 如需了解详情,请参阅 Python API 参考文档。
控制台
按照以下说明查看索引端点列表。
- 在 Google Cloud 控制台的 Vertex AI 部分中,前往部署和使用部分。选择 Vector Search。
- 选择页面顶部的索引端点标签页。
- 此时会显示所有现有的索引端点。
如需了解详情,请参阅 IndexEndpoint 的参考文档。
取消部署索引
如需取消部署索引,请运行以下代码:
gcloud
以下示例使用 gcloud ai index-endpoints undeploy-index 命令。
在使用下面的命令数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- DEPLOYED_INDEX_ID:用户指定的字符串,用于唯一标识已部署的索引。必须以字母开头,并且只包含字母、数字或下划线。如需了解格式准则,请参阅 DeployedIndex.id。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
在使用任何请求数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- DEPLOYED_INDEX_ID:用户指定的字符串,用于唯一标识已部署的索引。必须以字母开头,并且只包含字母、数字或下划线。如需了解格式准则,请参阅 DeployedIndex.id。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROJECT_NUMBER:自动生成的项目编号。
HTTP 方法和网址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:undeployIndex
请求 JSON 正文:
{
"deployed_index_id": "DEPLOYED_INDEX_ID"
}
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.aiplatform.v1.UndeployIndexOperationMetadata",
"genericMetadata": {
"createTime": "2022-01-13T04:09:56.641107Z",
"updateTime": "2022-01-13T04:09:56.641107Z"
}
}
}
Python
如需了解如何安装或更新 Vertex AI SDK for Python,请参阅安装 Vertex AI SDK for Python。 如需了解详情,请参阅 Python API 参考文档。
控制台
按照以下说明取消部署索引。
- 在 Google Cloud 控制台的 Vertex AI 部分中,前往部署和使用部分。选择 Vector Search。
- 系统会显示活跃索引列表。
- 选择您要取消部署的索引。系统会打开索引详情页面。
- 在已部署的索引部分下,确定您要取消部署的索引端点。
- 点击与该索引端点位于同一行的 选项菜单,然后选择取消部署。
- 系统会打开一个确认屏幕。点击取消部署。 注意:取消部署过程最多可能需要 30 分钟。
删除 IndexEndpoint
在删除 IndexEndpoint 之前,您必须undeploy所有已部署到该端点的索引。
gcloud
以下示例使用 gcloud ai index-endpoints delete 命令。
在使用下面的命令数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
执行以下命令:
Linux、macOS 或 Cloud Shell
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
在使用任何请求数据之前,请先进行以下替换:
- INDEX_ENDPOINT_ID:索引端点的 ID。
- LOCATION:您在其中使用 Vertex AI 的区域。
- PROJECT_ID:您的 Google Cloud 项目 ID。
- PROJECT_NUMBER:自动生成的项目编号。
HTTP 方法和网址:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID
如需发送您的请求,请展开以下选项之一:
您应该收到类似以下内容的 JSON 响应:
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeleteOperationMetadata",
"genericMetadata": {
"createTime": "2022-01-13T04:36:19.142203Z",
"updateTime": "2022-01-13T04:36:19.142203Z"
}
},
"done": true,
"response": {
"@type": "type.googleapis.com/google.protobuf.Empty"
}
}
Python
如需了解如何安装或更新 Vertex AI SDK for Python,请参阅安装 Vertex AI SDK for Python。 如需了解详情,请参阅 Python API 参考文档。
控制台
按照以下说明删除索引端点。
- 在 Google Cloud 控制台的 Vertex AI 部分中,前往部署和使用部分。选择 Vector Search。
- 选择页面顶部的索引端点标签页。
- 此时会显示所有现有的索引端点。
- 点击与要删除的索引端点位于同一行的 选项菜单,然后选择删除。
- 系统会打开一个确认屏幕。点击删除。索引端点现已删除。