에이전트 배포

Vertex AI Agent Engine에 에이전트를 배포하려면 다음 세 가지 기본 방법 중에서 선택하세요.

에이전트 객체에서 배포: Colab과 같은 환경에서 대화형 개발에 적합하며 메모리 내 local_agent 객체를 배포할 수 있습니다. 이 방법은 복잡하고 직렬화할 수 없는 구성요소가 포함되지 않은 구조의 에이전트에 가장 적합합니다.
소스 파일에서 배포: 이 방법은 CI/CD 파이프라인, Terraform과 같은 코드형 인프라 도구와 같은 자동화된 워크플로에 적합하며 완전한 선언적 자동 배포를 지원합니다. 로컬 소스 코드에서 직접 에이전트를 배포하며 Cloud Storage 버킷이 필요하지 않습니다.
Developer Connect에서 배포: Developer Connect를 통해 연결된 Git 저장소에서 관리되는 프로젝트에 권장됩니다. 이 방법을 사용하면 소스 코드에서 직접 에이전트 배포를 간소화하고 버전 관리, 팀 협업, CI/CD 파이프라인을 기본적으로 지원할 수 있습니다. 이 메서드를 사용하기 전에 Developer Connect Git 저장소 링크 설정의 안내에 따라 Git 저장소 링크를 설정하세요.

시작하려면 다음 단계를 따르세요.

기본 요건 완료
(선택사항) 배포를 위해 에이전트 구성
AgentEngine 인스턴스 만들기
(선택사항) 에이전트 리소스 ID 가져오기
(선택사항) 지원되는 작업을 나열합니다.
(선택사항) 배포된 에이전트에 권한 부여

배포를 위해 Agent Starter Pack 템플릿을 사용할 수도 있습니다.

기본 요건

에이전트를 배포하기 전에 다음 태스크가 완료되었는지 확인합니다.

(선택사항) 배포를 위해 에이전트 구성

에이전트에 대해 다음과 같은 선택적 구성을 할 수 있습니다.

패키지 요구사항 정의

참고: 소스 파일에서 배포하는 경우 requirements 파라미터를 사용할 필요가 없습니다. 대신 소스 코드 패키지 내에 requirements.txt 파일을 직접 포함하세요. 이 파일의 경로는 에이전트 엔진 인스턴스를 만들 때 requirements_file 매개변수에 지정할 수 있습니다.

에이전트 배포에 필요한 패키지 집합을 제공합니다. 패키지 집합은 pip로 설치할 항목 목록이거나 요구사항 파일 형식을 따르는 파일의 경로일 수 있습니다. 다음 권장사항을 따르세요.

재현 가능한 빌드의 경우 패키지 버전을 고정합니다. 추적해야 하는 일반 패키지에는 google-cloud-aiplatform, cloudpickle, langchain, langchain-core, langchain-google-vertexai, pydantic이 있습니다.
에이전트의 종속 항목 수를 최소화합니다. 이렇게 하면 종속 항목과 에이전트를 업데이트할 때 브레이킹 체인지 수가 줄어듭니다.

에이전트에 종속 항목이 없으면 requirements를 None으로 설정할 수 있습니다.

requirements = None

에이전트에 프레임워크별 템플릿이 사용되는 경우 에이전트를 개발할 때 가져온 SDK 버전 (예: 1.112.0)을 지정해야 합니다.

ADK

requirements = [
    "google-cloud-aiplatform[agent_engines,adk]",
    # any other dependencies
]

A2A

requirements = [
    "google-cloud-aiplatform[agent_engines]",
    "a2a-sdk>=0.3.4"
    # any other dependencies
]

LangChain

requirements = [
    "google-cloud-aiplatform[agent_engines,langchain]",
    # any other dependencies
]

LangGraph

requirements = [
    "google-cloud-aiplatform[agent_engines,langgraph]",
    # any other dependencies
]

AG2

requirements = [
    "google-cloud-aiplatform[agent_engines,ag2]",
    # any other dependencies
]

LlamaIndex

다음 안내는 LlamaIndex 쿼리 파이프라인에 적용됩니다.

requirements = [
    "google-cloud-aiplatform[agent_engines,llama_index]",
    # any other dependencies
]

패키지 requirements로 다음 작업을 할 수도 있습니다.

주어진 패키지 (예: google-cloud-aiplatform)의 버전을 고정하거나 상한값을 지정합니다.

  requirements = [
      # See https://pypi.org/project/google-cloud-aiplatform for the latest version.
      "google-cloud-aiplatform[agent_engines,adk]==1.112.0",
  ]

패키지 및 제약 조건을 추가합니다.

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk]==1.112.0",
      "cloudpickle==3.0", # new
  ]

GitHub 브랜치 또는 pull 요청의 패키지 버전을 가리킵니다.

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk] @ git+https://github.com/googleapis/python-aiplatform.git@BRANCH_NAME", # new
  ]

파일 (예: path/to/requirements.txt)에 요구사항 목록을 유지합니다.
```
  requirements = "path/to/requirements.txt"
  
```
여기에서 path/to/requirements.txt는 요구사항 파일 형식을 따르는 텍스트 파일입니다. 예를 들면 다음과 같습니다.
```
  google-cloud-aiplatform[agent_engines,adk]
  cloudpickle==3.0
  
```

추가 패키지 정의

참고: extra_packages 매개변수는 에이전트 객체에서 배포할 때만 사용됩니다.

로컬 파일 또는 필요한 로컬 Python 소스 파일이 포함된 디렉터리를 포함할 수 있습니다. 패키지 요구사항과 달리 이렇게 하면 사용자가 개발했지만 PyPI 또는 GitHub에서 사용할 수 없는 비공개 유틸리티를 사용할 수 있습니다.

에이전트에 추가 패키지가 필요하지 않으면 extra_packages를 None으로 설정할 수 있습니다.

extra_packages = None

extra_packages로 다음 작업을 수행할 수도 있습니다.

단일 파일(예: agents/agent.py)을 포함합니다.
```
  extra_packages = ["agents/agent.py"]
  
```

전체 디렉터리 (예: agents/)의 파일 집합을 포함합니다.

  extra_packages = ["agents"] # directory that includes agents/agent.py

Python 휠 바이너리(예: path/to/python_package.whl)를 지정합니다.

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk]",
      "cloudpickle==3.0",
      "python_package.whl",  # install from the whl file that was uploaded
  ]
  extra_packages = ["path/to/python_package.whl"]  # bundle the whl file for uploading

환경 변수 정의

에이전트가 사용하는 환경 변수가 있는 경우 env_vars= 인수에 이를 지정할 수 있습니다. 에이전트가 환경 변수를 사용하지 않는 경우 이를 None으로 설정할 수 있습니다.

env_vars = None

에이전트 ID를 사용하도록 구성된 에이전트와 함께 환경 변수로 비밀을 사용하는 경우 다음 형식을 갖는 Vertex AI 서비스 에이전트에 secretmanager.versions.access 권한 (roles/secretmanager.secretAccessor 역할에 포함됨)을 부여합니다.

service-PROJECT_NUMBER@gcp-sa-aiplatform.iam.gserviceaccount.com

구성된 에이전트 ID는 런타임에 사용되지만 Vertex AI 서비스 에이전트는 배포 중에 보안 비밀을 가져오는 데 사용됩니다. 추가된 권한을 통해 서비스 에이전트는 배포 프로세스 중에 Secret Manager에서 보안 비밀 값을 검색할 수 있습니다.

경고: 다음 환경 변수를 설정하면 안 됩니다. GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_QUOTA_PROJECT, GOOGLE_CLOUD_LOCATION, PORT, K_SERVICE, K_REVISION, K_CONFIGURATION, GOOGLE_APPLICATION_CREDENTIALS 또한 Vertex AI Agent Engine 환경 변수와 이름이 충돌하지 않도록 GOOGLE_CLOUD_AGENT_ENGINE 프리픽스를 사용하지 않아야 합니다.

환경 변수를 지정하는 방법에는 몇 가지 옵션이 있습니다.

딕셔너리

env_vars = {
  "VARIABLE_1": "VALUE_1",
  "VARIABLE_2": "VALUE_2",
}
# These environment variables will become available in Vertex AI Agent Engine
# through `os.environ`, e.g.
#
#   import os
#   os.environ["VARIABLE_1"] # will have the value "VALUE_1"
#
# and
#
#   os.environ["VARIABLE_2"] # will have the value "VALUE_2"
#

Secret Manager에서 보안 비밀을 참조하고 이를 환경 변수 (예: CLOUD_SQL_CREDENTIALS_SECRET)로 사용할 수 있도록 하려면 먼저 안내에 따라 프로젝트에서 CLOUD_SQL_CREDENTIALS_SECRET의 보안 비밀을 만듭니다. 그런 다음 환경 변수를 다음과 같이 지정합니다.

env_vars = {
  # ... (other environment variables and their values)
  "CLOUD_SQL_CREDENTIALS_SECRET": {"secret": SECRET_ID, "version": SECRET_VERSION_ID},
}

각 항목의 의미는 다음과 같습니다.

SECRET_VERSION_ID는 보안 비밀 버전의 ID입니다.
SECRET_ID는 보안 비밀의 ID입니다.

그런 다음 에이전트 코드에서 다음과 같이 보안 비밀을 참조할 수 있습니다.

secret = os.environ.get("CLOUD_SQL_CREDENTIALS_SECRET")
if secret:
  # Secrets are stored as strings, so use json.loads to parse JSON
  # payloads.
  return json.loads(secret)

env_vars = ["VARIABLE_1", "VARIABLE_2"]
# This corresponds to the following code snippet:
#
#   import os
#
#   env_vars = {
#     "VARIABLE_1": os.environ["VARIABLE_1"],
#     "VARIABLE_2": os.environ["VARIABLE_2"],
#   }

또한 에이전트의 ID 및 권한 설정의 안내에 따라 에이전트에게 Secret Manager 보안 비밀 접근자(roles/secretmanager.secretAccessor) 권한을 부여해야 합니다.

맞춤설정된 리소스 제어 정의

최소 및 최대 애플리케이션 인스턴스 수, 각 컨테이너의 리소스 한도, 각 컨테이너의 동시 실행과 같은 에이전트의 런타임 리소스 제어를 지정할 수 있습니다.

min_instances: 항상 실행 상태로 유지할 최소 애플리케이션 인스턴스 수입니다(범위: [0, 10]). 기본값은 1입니다.

참고: 이 기능이 미리보기 버전인 동안에는 최소 인스턴스 수를 더 높게 구성하더라도 에이전트가 유휴 상태인 시간에 대한 요금이 청구되지 않습니다. 이 청구 동작은 향후 변경될 수 있습니다.
max_instances: 트래픽 증가를 처리하기 위해 실행할 수 있는 애플리케이션 인스턴스의 최대 수입니다(범위는 [1, 1000]). 기본값은 100입니다. VPC-SC 또는 PSC-I가 사용 설정된 경우 허용되는 범위는 Vertex AI Agent Engine 리소스당 [1, 100]입니다.
resource_limits: 각 컨테이너의 리소스 한도입니다. cpu 및 memory 키만 지원됩니다. 기본값은 {"cpu": "4", "memory": "4Gi"}입니다.
- cpu에 지원되는 값은 1, 2, 4, 6, 8뿐입니다. 자세한 내용은 CPU 할당 구성을 참고하세요.
- memory에 지원되는 값은 1Gi, 2Gi, ..., 32Gi뿐입니다.
- 다양한 메모리 값에 필요한 CPU는 메모리 한도 구성을 참조하세요.
container_concurrency: 각 컨테이너 및 에이전트 서버의 동시 실행입니다. 권장값은 2 * cpu + 1입니다. 기본값은 9입니다.

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "min_instances": 1,
        "max_instances": 10,
        "resource_limits": {"cpu": "4", "memory": "8Gi"},
        "container_concurrency": 9,
        # ... other configs
    }
)

런타임 리소스를 최적화하는 방법에 관한 권장사항은 Vertex AI Agent Engine 런타임 최적화 및 확장을 참고하세요.

빌드 옵션 정의

에이전트의 컨테이너 이미지를 빌드할 때 실행할 설치 스크립트와 같은 에이전트의 빌드 옵션을 지정할 수 있습니다. 이는 시스템 종속 항목 (예: gcloud cli, npx) 또는 기타 맞춤 설정을 설치하는 데 유용합니다. 스크립트는 루트 권한으로 실행됩니다.

설치 스크립트를 사용하려면 installation_scripts라는 디렉터리를 만들고 디렉터리 내에 셸 스크립트를 배치합니다.

.
├── ...
└── installation_scripts/
    └── install.sh

다음으로 extra_packages에서 installation_scripts 디렉터리를 지정하고 build_options에서 스크립트 경로를 지정합니다.

extra_packages = [..., "installation_scripts/install.sh"]
build_options = {"installation_scripts": ["installation_scripts/install.sh"]}

다음 일반 설치 스크립트 중 하나를 사용할 수 있습니다.

install_npx.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

echo "--- Installing System-Wide Node.js v20.x ---"

# 1. Install prerequisites
apt-get update
apt-get install -y ca-certificates curl gnupg

# 2. Add the NodeSource repository GPG key
mkdir -p /etc/apt/keyrings
curl -fsSL https://deb.nodesource.com/gpgkey/nodesource-repo.gpg.key | gpg --dearmor -o /etc/apt/keyrings/nodesource.gpg

# 3. Add the NodeSource repository for Node.js v20
NODE_MAJOR=20
echo "deb [signed-by=/etc/apt/keyrings/nodesource.gpg] https://deb.nodesource.com/node_$NODE_MAJOR.x nodistro main" | tee /etc/apt/sources.list.d/nodesource.list

# 4. Update package lists again and install Node.js
apt-get update
apt-get install nodejs -y

echo "--- System-wide Node.js installation complete ---"
echo "Verifying versions:"

# These commands will now work for ANY user because node and npx
# are installed in /usr/bin/ which is in everyone's default PATH.
node -v
npm -v
npx -v

install_uvx.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

echo "Starting setup..."

# Install uv
apt-get update
apt-get install -y curl
curl -LsSf https://astral.sh/uv/install.sh | env UV_INSTALL_DIR="/usr/local/bin" sh

# These commands will now work for ANY user because uv and uvx
# are installed in /usr/local/bin/ which is in everyone's default PATH.
uv --version
uvx --version

install_gcloud_cli.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

apt-get install -y curl gpg
curl https://packages.cloud.google.com/apt/doc/apt-key.gpg | gpg --dearmor -o /usr/share/keyrings/cloud.google.gpg
echo "deb [signed-by=/usr/share/keyrings/cloud.google.gpg] https://packages.cloud.google.com/apt cloud-sdk main" | tee -a /etc/apt/sources.list.d/google-cloud-sdk.list
apt-get update -y && apt-get install google-cloud-cli -y

gcloud --version

에이전트 프레임워크 정의

에이전트가 사용하는 에이전트 프레임워크를 지정할 수 있습니다.

agent_framework = "google-adk"

지원되는 값은 다음과 같습니다.

agent_framework를 지정하지 않으면 에이전트 객체에서 배포하는 경우 값이 자동 감지됩니다. 소스 파일에서 배포하는 경우 agent_framework은 기본적으로 `custom`으로 설정됩니다.

Cloud Storage 폴더 정의

참고: gcs_dir_name 파라미터는 에이전트 객체에서 배포할 때만 사용됩니다.

스테이징 아티팩트가 Cloud Storage 버킷의 기존 폴더에 해당하면 이를 덮어씁니다. 필요한 경우 스테이징 아티팩트의 Cloud Storage 폴더를 지정할 수 있습니다. 기본 폴더에서 파일을 덮어써도 괜찮다면 gcs_dir_name을 None로 설정할 수 있습니다.

gcs_dir_name = None

개발, 스테이징, 프로덕션과 같은 여러 환경에서 파일을 덮어쓰지 않도록 하려면 해당 폴더를 설정하고 다음과 같이 아티팩트를 스테이징할 폴더를 지정하면 됩니다.

gcs_dir_name = "dev" # or "staging" or "prod"

충돌을 방지해야 할 경우에는 무작위 uuid를 생성하면 됩니다.

import uuid
gcs_dir_name = str(uuid.uuid4())

표시 이름 정의

ReasoningEngine 리소스의 표시 이름을 설정할 수 있습니다.

display_name = "Currency Exchange Rate Agent (Staging)"

설명 정의

ReasoningEngine 리소스의 설명을 설정할 수 있습니다.

description = """
An agent that has access to tools for looking up the exchange rate.

If you run into any issues, please contact the dev team.
"""

라벨 정의

ReasoningEngine 리소스의 라벨을 키-값 문자열 쌍의 사전으로 설정할 수 있습니다. 다음은 그 예시입니다.

labels = {"author": "username", "version": "latest"}

기본 상담사 ID 구성

에이전트를 만들 때 Vertex AI Agent Engine에 배포하는 에이전트에 고유한 ID를 프로비저닝할 수 있습니다. ID는 Vertex AI Agent Engine의 에이전트 리소스 ID에 연결되며 에이전트를 개발하는 데 사용한 에이전트 프레임워크와는 독립적입니다.

identity_type=AGENT_IDENTITY

자세한 내용은 에이전트 ID로 에이전트 만들기를 참고하세요.

커스텀 서비스 계정 구성

에이전트 ID 또는 기본 ID 대신 배포된 에이전트의 ID로 커스텀 서비스 계정을 구성할 수 있습니다.

이렇게 하려면 Agent Engine 인스턴스를 만들거나 업데이트할 때 커스텀 서비스 계정의 이메일을 service_account로 지정합니다. 예를 들면 다음과 같습니다.

# Create a new instance
client.agent_engines.create(
    agent=local_agent,
    config={
        "service_account": "my-custom-service-account@my-project.iam.gserviceaccount.com",
        # ...
    },
)

# Update an existing instance
resource_name = "projects/{project_id}/locations/{location}/reasoningEngines/{reasoning_engine_id}"
client.agent_engines.update(
    name=resource_name,
    agent=local_agent,
    config={
        "service_account": "my-new-custom-service-account@my-project.iam.gserviceaccount.com",
        # ...
    },
)

참고: projects/{project_id}/serviceAccounts/{service_account_email}와 같은 전체 리소스 URI가 아닌 서비스 계정 이메일만 지정하세요.

Private Service Connect 인터페이스 구성

Private Service Connect 인터페이스 및 DNS 피어링이 설정된 경우 에이전트를 배포하는 동안 네트워크 연결 및 비공개 DNS 피어링을 지정할 수 있습니다.

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "psc_interface_config": {
            "network_attachment": "NETWORK_ATTACHMENT",
            "dns_peering_configs": [
                {
                    "domain": "DOMAIN_SUFFIX",
                    "target_project": "TARGET_PROJECT",
                    "target_network": "TARGET_NETWORK",
                },
            ],
        },
    },
)

각 항목의 의미는 다음과 같습니다.

NETWORK_ATTACHMENT은 네트워크 연결의 이름 또는 전체 경로입니다. 네트워크 연결이 에이전트 엔진을 사용하는 위치와 다른 프로젝트(예: 공유 VPC 호스트 프로젝트)에 생성된 경우 네트워크 연결의 전체 경로를 전달해야 합니다.
DOMAIN_SUFFIX는 비공개 DNS 피어링을 설정할 때 만든 비공개 Cloud DNS 영역의 DNS 이름입니다.
TARGET_PROJECT는 VPC 네트워크를 호스팅하는 프로젝트입니다. 네트워크 연결 프로젝트와 다를 수 있습니다.
TARGET_NETWORK는 VPC 네트워크 이름입니다.

단일 공유 네트워크 연결 또는 고유한 전용 네트워크 연결을 사용하도록 여러 에이전트를 구성할 수 있습니다. 공유 네트워크 연결을 사용하려면 생성하는 각 에이전트의 psc_interface_config에 동일한 네트워크 연결을 제공하세요.

고객 관리 암호화 키 구성

커스텀 키를 사용하여 에이전트의 저장 데이터를 암호화할 수 있습니다. 자세한 내용은 Agent Engine 고객 관리 암호화 키 (CMEK)를 참고하세요.

에이전트의 커스텀 키 (CMEK)를 구성하려면 Agent Engine 인스턴스를 만들 때 encryption_spec 파라미터에 키 리소스 이름을 제공해야 합니다.

# The fully qualified key name
kms_key_name = "projects/PROJECT_ID/locations/LOCATION/keyRings/KEY_RING/cryptoKeys/KEY_NAME"

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "encryption_spec": {"kms_key_name": kms_key_name},
        # ... other parameters
    },
)

Developer Connect Git 저장소 링크 설정

Developer Connect를 사용하여 Git 저장소에서 배포하려면 Developer Connect 문서에 따라 연결을 만들고 특정 저장소에 연결하세요. 링크의 리소스 이름은 배포 중에 git_repository_link로 사용되며 projects/PROJECT_ID/locations/LOCATION/connections/CONNECTION_ID/gitRepositoryLinks/REPO_ID 형식을 따릅니다.

`AgentEngine` 인스턴스 만들기

이 섹션에서는 에이전트를 배포하기 위한 AgentEngine 인스턴스를 만드는 방법을 설명합니다.

Vertex AI Agent Engine에서 에이전트를 배포하려면 다음 방법 중에서 선택하세요.

양방향 개발을 위해 에이전트 객체에서 배포
Git 기반 워크플로를 위해 Developer Connect에서 배포합니다.
자동화된 파일 기반 워크플로를 위해 소스 파일에서 배포합니다.

에이전트 객체에서

Vertex AI에 에이전트를 배포하려면 client.agent_engines.create를 사용하여 local_agent 객체를 선택적 구성과 함께 전달합니다.

remote_agent = client.agent_engines.create(
    agent=local_agent,                                  # Optional.
    config={
        "requirements": requirements,                   # Optional.
        "extra_packages": extra_packages,               # Optional.
        "gcs_dir_name": gcs_dir_name,                   # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "identity_type": identity_type,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
        "agent_framework": agent_framework,             # Optional.
    },
)

배포에는 몇 분 정도 걸리며, 이 시간 동안 백그라운드에서 다음 단계가 진행됩니다.

다음 아티팩트 번들이 로컬로 생성됩니다.
- *.pkl: local_agent에 해당하는 피클 파일입니다.
- requirements.txt: 패키지 요구사항이 포함된 텍스트 파일입니다.
- dependencies.tar.gz: 추가 패키지가 포함된 tar 파일입니다.
아티팩트를 스테이징하기 위해 번들이 Cloud Storage(해당 폴더 아래)에 업로드됩니다.
해당 아티팩트의 Cloud Storage URI는 PackageSpec에 지정됩니다.
Vertex AI Agent Engine 서비스가 요청을 수신하고 컨테이너를 빌드하며 백엔드에서 HTTP 서버를 시작합니다.

Developer Connect

Vertex AI의 Developer Connect에서 배포하려면 구성 사전에서 developer_connect_source, entrypoint_module, entrypoint_object를 제공하여 client.agent_engines.create를 사용하세요. 다른 선택적 구성도 함께 제공할 수 있습니다. 이 방법을 사용하면 연결된 Git 저장소에서 코드를 직접 배포할 수 있습니다.

remote_agent = client.agent_engines.create(
    config={
        "developer_connect_source": {                   # Required.
            "git_repository_link": "projects/PROJECT_ID/locations/LOCATION/connections/CONNECTION_ID/gitRepositoryLinks/REPO_ID",
            "revision": "main",
            "dir": "path/to/dir",
        },
        "entrypoint_module": "agent",                   # Required.
        "entrypoint_object": "root_agent",              # Required.
        "requirements_file": "requirements.txt",        # Optional.
        # Other optional configs:
        # "env_vars": {...},
        # "service_account": "...",
    },
)

Developer Connect 배포의 매개변수는 다음과 같습니다.

developer_connect_source (필수, dict): 소스 코드 가져오기 구성입니다. 자세한 내용은 Developer Connect Git 저장소 링크 설정을 참고하세요.
- git_repository_link (필수, str): Developer Connect Git 저장소 링크 리소스 이름입니다.
- revision (필수, str): 가져올 버전 (브랜치, 태그 또는 커밋 SHA)입니다.
- dir (필수, str): 저장소 내 에이전트 코드의 루트 디렉터리입니다.
entrypoint_module (필수, str): developer_connect_source.dir에 지정된 디렉터리를 기준으로 에이전트 진입점을 포함하는 Python 모듈 이름입니다.
entrypoint_object (필수, str): 에이전트 애플리케이션을 나타내는 entrypoint_module 내 호출 가능 객체의 이름입니다 (예: root_agent).
requirements_file (선택사항, str): 소스 루트를 기준으로 한 pip 요구사항 파일의 경로입니다. 기본값은 requirements.txt입니다.

배포에는 몇 분 정도 걸리며, 이 시간 동안 백그라운드에서 다음 단계가 진행됩니다.

Vertex AI Agent Engine 서비스는 지정된 Git 저장소 버전에서 소스 코드를 가져옵니다.
서비스가 requirements_file에서 종속 항목을 설치합니다 (제공된 경우).
서비스는 지정된 entrypoint_module 및 entrypoint_object를 사용하여 에이전트 애플리케이션을 시작합니다.

소스 파일에서

Vertex AI에서 소스 파일로 배포하려면 구성 사전에서 source_packages, entrypoint_module, entrypoint_object, class_methods와 기타 선택적 구성을 제공하여 client.agent_engines.create를 사용하세요. 이 메서드를 사용하면 에이전트 객체나 Cloud Storage 버킷을 전달할 필요가 없습니다.

remote_agent = client.agent_engines.create(
    config={
        "source_packages": source_packages,             # Required.
        "entrypoint_module": entrypoint_module,         # Required.
        "entrypoint_object": entrypoint_object,         # Required.
        "class_methods": class_methods,                 # Required.
        "requirements_file": requirements_file,         # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "identity_type": identity_type,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
        "agent_framework": agent_framework,             # Optional.
    },
)

인라인 소스 배포의 매개변수는 다음과 같습니다.

source_packages (필수, list[str]): 배포에 포함할 로컬 파일 또는 디렉터리 경로 목록입니다. source_packages의 파일 및 디렉터리의 총 크기는 8MB를 초과해서는 안 됩니다.
entrypoint_module (필수, str): 에이전트 진입점을 포함하는 정규화된 Python 모듈 이름입니다 (예: agent_dir.agent).
entrypoint_object (필수, str): 에이전트 애플리케이션을 나타내는 entrypoint_module 내 호출 가능 객체의 이름입니다 (예: root_agent).

class_methods (필수, list[dict]): 에이전트의 노출된 메서드를 정의하는 사전 목록입니다. 각 사전에는 name (필수), api_mode (필수), parameters 필드가 포함됩니다. 맞춤 에이전트의 메서드에 관한 자세한 내용은 지원되는 작업 목록을 참고하세요.

예를 들면 다음과 같습니다.

  "class_methods": [
      {
          "name": "method_name",
          "api_mode": "", # Possible options are: "", "async", "async_stream", "stream", "bidi_stream"
          "parameters": {
              "type": "object",
              "properties": {
                  "param1": {"type": "string", "description": "Description of param1"},
                  "param2": {"type": "integer"}
              },
              "required": ["param1"]
          }
      }
  ]
  ```

requirements_file (선택사항, str): source_packages에 지정된 경로 내에 있는 pip 요구사항 파일의 경로입니다. 패키지 소스의 루트 디렉터리에 있는 requirements.txt가 기본값입니다.

배포에는 몇 분 정도 걸리며, 이 시간 동안 백그라운드에서 다음 단계가 진행됩니다.

Vertex AI SDK는 source_packages에 지정된 경로의 tar.gz 아카이브를 만듭니다.
이 보관 파일은 인코딩되어 Vertex AI API로 직접 전송됩니다.
Vertex AI Agent Engine 서비스는 보관 파일을 수신하고, 압축을 풀고, requirements_file (제공된 경우)에서 종속 항목을 설치하고, 지정된 entrypoint_module 및 entrypoint_object을 사용하여 에이전트 애플리케이션을 시작합니다.

다음은 소스 파일에서 에이전트를 배포하는 예입니다.

from google.cloud.aiplatform import vertexai

# Example file structure:
# /agent_directory
#     ├── agent.py
#     ├── requirements.txt

# Example agent_directory/agent.py:
# class MyAgent:
#     def ask(self, question: str) -> str:
#         return f"Answer to {question}"
# root_agent = MyAgent()

remote_agent = client.agent_engines.create(
  config={
      "display_name": "My Agent",
      "description": "An agent deployed from a local source.",
      "source_packages": ["agent_directory"],
      "entrypoint_module": "agent_directory.agent",
      "entrypoint_object": "root_agent",
      "requirements_file": "requirements.txt",
      "class_methods": [
          {"name": "ask", "api_mode": "", "parameters": {
              "type": "object",
              "properties": {
                  "question": {"type": "string"}
              },
              "required": ["question"]
          }},
      ],
      # Other optional configs:
      # "env_vars": {...},
      # "service_account": "...",
  }
)

배포 지연 시간은 필요한 패키지를 설치하는 데 걸리는 총 시간에 따라 달라집니다. 배포된 후 remote_agent은 Vertex AI에서 실행되는 local_agent 인스턴스에 해당하며 이를 쿼리 또는 삭제할 수 있습니다.

remote_agent 객체는 다음을 포함하는 AgentEngine 클래스에 해당합니다.

배포된 에이전트에 관한 정보가 포함된 remote_agent.api_resource remote_agent.operation_schemas()를 호출하여 remote_agent에서 지원하는 작업 목록을 반환할 수도 있습니다. 자세한 내용은 지원되는 작업을 참고하세요.
동기 서비스 상호작용을 허용하는 remote_agent.api_client
비동기 서비스 상호작용을 허용하는 remote_agent.async_api_client

(선택사항) 에이전트 리소스 ID 가져오기

배포된 각 에이전트에는 고유한 식별자가 포함됩니다. 다음 명령어를 실행하여 배포된 에이전트의 리소스 이름을 가져올 수 있습니다.

remote_agent.api_resource.name

응답으로 다음과 같은 문자열이 표시됩니다.

"projects/PROJECT_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"

각 항목의 의미는 다음과 같습니다.

PROJECT_ID는 배포된 에이전트가 실행되는 Google Cloud 프로젝트 ID입니다.
LOCATION은 배포된 에이전트가 실행되는 리전입니다.
RESOURCE_ID는 배포된 에이전트의 ID이며 reasoningEngine 리소스로 등록되어 있습니다.

(선택사항) 지원되는 작업 나열

배포된 각 에이전트에는 지원되는 작업 목록이 있습니다. AgentEngine.operation_schemas를 사용하여 배포된 에이전트에서 지원하는 작업 목록을 가져올 수 있습니다.

remote_agent.operation_schemas()

각 작업의 스키마는 호출할 수 있는 에이전트의 메서드 정보를 문서화하는 사전입니다. 지원되는 작업 집합은 에이전트를 개발하는 데 사용한 프레임워크에 따라 다릅니다.

(선택사항) 배포된 에이전트에 권한 부여

배포된 에이전트에 추가 권한을 부여해야 하는 경우 에이전트의 ID 및 권한 설정의 안내를 따르세요.

에이전트 배포 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

기본 요건

(선택사항) 배포를 위해 에이전트 구성

패키지 요구사항 정의

ADK

A2A

LangChain

LangGraph

AG2

LlamaIndex

추가 패키지 정의

환경 변수 정의

딕셔너리

목록

맞춤설정된 리소스 제어 정의

빌드 옵션 정의

install_npx.sh

install_uvx.sh

install_gcloud_cli.sh

에이전트 프레임워크 정의

Cloud Storage 폴더 정의

표시 이름 정의

설명 정의

라벨 정의

기본 상담사 ID 구성

커스텀 서비스 계정 구성

Private Service Connect 인터페이스 구성

고객 관리 암호화 키 구성

Developer Connect Git 저장소 링크 설정

AgentEngine 인스턴스 만들기

에이전트 객체에서

Developer Connect

소스 파일에서

(선택사항) 에이전트 리소스 ID 가져오기

(선택사항) 지원되는 작업 나열

(선택사항) 배포된 에이전트에 권한 부여

다음 단계

에이전트 배포

`AgentEngine` 인스턴스 만들기