部署代理

如要在 Vertex AI Agent Engine 部署代理,請按照下列步驟操作:

  1. 完成必要條件
  2. (選用) 設定要部署的代理程式
  3. 建立 AgentEngine 執行個體
  4. (選用) 取得代理程式資源 ID
  5. (選用) 列出支援的作業
  6. (選用) 授予已部署的代理程式權限

您也可以使用 Agent Starter Pack 範本進行部署。

必要條件

部署代理程式前,請務必完成下列工作:

  1. 設定環境
  2. 開發代理程式

(選用) 設定要部署的代理程式

您可以為代理程式設定下列選用項目:

建立 AgentEngine 執行個體

如要在 Vertex AI 上部署代理程式,請使用 client.agent_engines.create 傳遞 local_agent 物件和任何選用設定

remote_agent = client.agent_engines.create(
    agent=local_agent,                                  # Optional.
    config={
        "requirements": requirements,                   # Optional.
        "extra_packages": extra_packages,               # Optional.
        "gcs_dir_name": gcs_dir_name,                   # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
    },
)

部署作業需要幾分鐘,期間系統會在背景執行下列步驟:

  1. 系統會在本地產生下列成果套件:

    • *.pkl 對應於 local_agent 的 Pickle 檔案。
    • requirements.txt:包含套件需求的文字檔。
    • dependencies.tar.gz,其中包含任何額外套件
  2. 套件會上傳至 Cloud Storage (位於對應的資料夾),用於暫存構件。

  3. 各個構件的 Cloud Storage URI 會在 PackageSpec 中指定。

  4. Vertex AI Agent Engine 服務會接收要求、建構容器,並在後端啟動 HTTP 伺服器。

部署延遲時間取決於安裝必要套件的總時間。部署完成後,remote_agent 會對應至在 Vertex AI 上執行的 local_agent 執行個體,並可查詢或刪除。與代理程式的本機執行個體不同。

remote_agent 物件對應於 AgentEngine 類別,其中包含下列屬性:

(選用) 取得服務專員資源 ID

每個已部署的代理程式都有專屬 ID。您可以執行下列指令,取得已部署代理程式的資源名稱:

remote_agent.api_resource.name

回應應如下列字串所示:

"projects/PROJECT_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"

其中

  • PROJECT_ID 是已部署代理程式的 Google Cloud 專案 ID

  • LOCATION 是部署的代理程式執行的區域

  • RESOURCE_ID 是已部署代理程式的 ID,屬於 reasoningEngine 資源

(選用) 列出支援的作業

每個已部署的代理程式都有支援的作業清單。您可以執行下列指令,取得已部署代理程式支援的作業清單:

remote_agent.operation_schemas()

每項作業的結構定義都是字典,其中記錄了可呼叫的代理程式方法資訊。支援的作業集取決於您用來開發代理程式的架構:

(選用) 授予已部署的代理程式權限

如果部署的代理程式需要額外權限,請按照「為代理程式設定身分和權限」一文中的操作說明進行設定。

後續步驟