배포된 에이전트 관리

이 페이지에서는 Vertex AI Agent Engine 관리형 런타임에 배포된 에이전트를 관리하는 방법을 설명합니다. 배포된 에이전트는 Vertex AI에서 reasoningEngine 유형의 리소스입니다.

배포된 에이전트 나열

특정 프로젝트 및 위치에 배포된 모든 상담사를 나열합니다.

콘솔

Google Cloud 콘솔에서 Vertex AI Agent Engine 페이지로 이동합니다.

Agent Engine으로 이동

선택한 프로젝트에 속하는 배포된 에이전트가 목록에 표시됩니다. 필터 필드를 사용하여 지정된 열을 기준으로 목록을 필터링할 수 있습니다.

Python용 Vertex AI SDK

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

for agent in client.agent_engines.list():
    print(agent)

display_name로 목록을 필터링하는 방법은 다음과 같습니다.

for agent in client.agent_engines.list(
    config={
        "filter": 'display_name="DISPLAY_NAME"',
    },
):
    print(agent)

REST

reasoningEngines.list 메서드를 호출합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: GCP 프로젝트 ID
LOCATION: 지원되는 리전

HTTP 메서드 및 URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

cURL(Linux, macOS, Cloud Shell)

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하거나 gcloud CLI에 자동으로 로그인하는 Cloud Shell을 사용하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

다음 명령어를 실행합니다.

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines"

PowerShell(Windows)

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines" | Select-Object -Expand Content

성공 상태 코드(2xx)와 빈 응답을 받게 됩니다.

배포된 에이전트 가져오기

배포된 각 에이전트에는 고유한 RESOURCE_ID 식별자가 있습니다. 자세한 내용은 에이전트 배포를 참조하세요.

콘솔

Google Cloud 콘솔에서 Vertex AI Agent Engine 페이지로 이동합니다.

Agent Engine으로 이동

선택한 프로젝트에 속하는 배포된 에이전트가 목록에 표시됩니다. 필터 필드를 사용하여 지정된 열을 기준으로 목록을 필터링할 수 있습니다.
지정된 에이전트의 이름을 클릭합니다. 에이전트의 측정항목 페이지가 열립니다.
(선택사항) 에이전트의 배포 세부정보를 보려면 배포 세부정보를 클릭합니다. 배포 세부정보 창이 열립니다. 창을 닫으려면 완료를 클릭합니다.
(선택사항) 에이전트의 query 및 streamQuery URL을 보려면 API URL을 클릭합니다. API URL 창이 열립니다. 창을 닫으려면 완료를 클릭합니다.

Python용 Vertex AI SDK

다음 코드를 사용하면 특정 배포된 에이전트를 가져올 수 있습니다.

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

remote_agent = client.agent_engines.get(
    name="projects/PROJECT_ID_OR_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

reasoningEngines.get 메서드를 호출합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: GCP 프로젝트 ID
LOCATION: 지원되는 리전
RESOURCE_ID: 배포된 출시 버전의 리소스 ID

HTTP 메서드 및 URL:

GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

cURL(Linux, macOS, Cloud Shell)

다음 명령어를 실행합니다.

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell(Windows)

다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

성공 상태 코드(2xx)와 빈 응답을 받게 됩니다.

배포된 에이전트 업데이트

배포된 에이전트의 하나 이상의 필드를 동시에 업데이트할 수 있지만 업데이트할 필드 중 하나 이상을 지정해야 합니다. 배포된 에이전트를 업데이트하는 데 걸리는 시간은 실행되는 업데이트에 따라 다르지만 일반적으로 몇 초에서 몇 분 정도 걸립니다.

콘솔

Google Cloud 콘솔에서 Vertex AI Agent Engine 페이지로 이동합니다.

Agent Engine으로 이동
지정된 에이전트의 경우 추가 작업 메뉴()를 클릭합니다.
수정을 클릭합니다. 에이전트의 수정 창이 열립니다.
에이전트의 표시 이름 또는 설명을 수정합니다.
저장을 클릭합니다.

Python용 Vertex AI SDK

배포된 에이전트(RESOURCE_NAME에 해당)를 업데이트된 에이전트(UPDATED_AGENT에 해당)로 업데이트하려면 다음 단계를 따르세요.

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.update(
    name=RESOURCE_NAME,                    # Required.
    agent=UPDATED_AGENT,                   # Optional.
    config={                                                # Optional.
        "requirements": REQUIREMENTS,      # Optional.
        "display_name": "DISPLAY_NAME",    # Optional.
        "description": "DESCRIPTION",      # Optional.
        "extra_packages": EXTRA_PACKAGES,  # Optional.
    },
)

인수는 에이전트를 배포할 때와 동일합니다.

REST

reasoningEngines.patch 메서드를 호출하고 update_mask를 제공하여 업데이트할 필드를 지정합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: GCP 프로젝트 ID
LOCATION: 지원되는 리전
RESOURCE_ID: 배포된 출시 버전의 리소스 ID
update_mask: 업데이트할 필드의 쉼표로 구분된 목록

HTTP 메서드 및 URL:

PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"

JSON 요청 본문:

{
"displayName": "DISPLAY_NAME",
"description": "DESCRIPTION"
}

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

cURL(Linux, macOS, Cloud Shell)

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X PATCH \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description""

PowerShell(Windows)

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method PATCH `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description"" | Select-Object -Expand Content

성공 상태 코드(2xx)와 빈 응답을 받게 됩니다.

배포된 에이전트의 원격 분석 구성

에이전트 개발 중에 트레이스를 사용 설정한 경우 Google Cloud 콘솔을 사용하여 배포된 에이전트의 원격 분석을 구성할 수 있습니다.

원격 분석이 사용 설정된 배포된 에이전트의 원격 분석을 구성합니다.

Google Cloud 콘솔에서 Vertex AI Agent Engine 페이지로 이동합니다.

Agent Engine으로 이동

선택한 프로젝트에 속한 Agent Engine 인스턴스가 목록에 표시됩니다. 필터 필드를 사용하여 지정된 열을 기준으로 목록을 필터링할 수 있습니다.
Agent Engine 인스턴스의 행을 찾습니다. 원격 분석 구성 열에서 구성을 클릭합니다. 서비스 구성 패널이 열립니다.
다음과 같이 구성할 수 있습니다.
- 관측 가능성: 다음을 구성할 수 있습니다.
  - OpenTelemetry trace 및 로그의 계측 사용 설정: 에이전트 모니터링 가능성 대시보드와 trace 페이지를 채우려면 전환 버튼을 사용 설정 위치로 클릭합니다.
  - 프롬프트 입력 및 대답 출력 로깅 사용 설정: 사용자 프롬프트 및 대답의 전체 콘텐츠를 수집하고 저장하려면 전환 버튼을 사용 설정 위치로 클릭합니다.
  에이전트의 원격 분석 수집이 사용 중지된 경우 관측 가능성의 구성 옵션을 보려면 에이전트를 다시 배포하고 Vertex AI SDK 버전을 >= 1.126.1로 업데이트해야 합니다.
- 컨테이너: 배포된 에이전트의 컨테이너 설정을 구성합니다.
  - 확장: 최소 인스턴스 수와 최대 인스턴스 수를 입력합니다.
  - 리소스: 각 컨테이너의 메모리 및 CPU 한도를 선택합니다.
  - 컨테이너 동시 실행: 최소 인스턴스 수를 입력하여 각 컨테이너 및 에이전트 서버의 동시 실행을 설정합니다. 권장 값은 (2 * CPU + 1)이며 기본값은 9입니다.
- 액세스 및 권한: IAM에서 권한 관리를 클릭하여 연결된 서비스 계정의 에이전트 권한을 관리합니다.
- 배포 세부정보: 리소스 이름 및 표시 이름을 비롯한 에이전트의 배포 세부정보를 확인합니다.
- 메모리 뱅크: 메모리 생성 및 메모리 검색을 비롯한 에이전트의 메모리 뱅크 세부정보를 확인합니다.
업데이트 또는 닫기를 클릭합니다.

배포된 에이전트의 측정항목 보기

배포된 에이전트의 경우 콘솔을 사용하여 에이전트의 측정항목을 볼 수 있습니다.

Google Cloud 콘솔에서 Vertex AI Agent Engine 페이지로 이동합니다.

Agent Engine으로 이동

선택한 프로젝트에 속하는 배포된 에이전트가 목록에 표시됩니다. 필터 필드를 사용하여 지정된 열을 기준으로 목록을 필터링할 수 있습니다.
상담사의 이름을 클릭합니다. 선택한 에이전트의 대시보드가 표시됩니다.
다음 대시보드 탭 중 하나를 선택합니다.
- 개요: 에이전트 지연 시간, 에이전트 요청 수, 에이전트 오류율 등 에이전트의 측정항목 요약 대시보드를 확인합니다.
- 모델: 모델 호출 수, 모델 오류율, 모델 토큰 사용량 등 에이전트 모델의 측정항목 대시보드를 확인합니다.
- 도구: 도구 호출 수, 도구 오류율, 도구 지연 시간 등 에이전트 도구의 측정항목 대시보드를 확인합니다.
- 사용량: 입력 및 출력별 토큰 사용량, 컨테이너 CPU 할당, 컨테이너 메모리 할당 등 에이전트 사용량의 측정항목 대시보드를 확인합니다.
- 로그: 에이전트에 대해 Cloud Logging을 사용 설정한 경우 에이전트의 로그를 봅니다.

Vertex AI Agent Engine 대시보드

배포된 에이전트 삭제

Vertex AI Agent Engine 관리형 런타임에서 배포된 에이전트를 삭제합니다.

콘솔

Google Cloud 콘솔에서 Vertex AI Agent Engine 페이지로 이동합니다.

Agent Engine으로 이동
지정된 에이전트의 경우 추가 작업 메뉴()를 클릭합니다.
삭제를 클릭합니다.
에이전트 삭제를 클릭합니다.

Python용 Vertex AI SDK

이미 배포된 에이전트의 기존 인스턴스(remote_agent)가 있는 경우 다음 명령어를 실행할 수 있습니다.

remote_agent.delete(
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

또는 다음과 같이 agent_engines.delete()를 호출하여 RESOURCE_NAME에 해당하는 배포된 에이전트를 삭제할 수 있습니다.

import vertexai

client = vertexai.Client(  # For service interactions via client.agent_engines
    project="PROJECT_ID",
    location="LOCATION",
)

client.agent_engines.delete(
    name=RESOURCE_NAME,
    force=True, # Optional, if the agent has resources (e.g. sessions, memory)
)

REST

reasoningEngines.delete 메서드를 호출합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: GCP 프로젝트 ID
LOCATION: 지원되는 리전
RESOURCE_ID: 배포된 출시 버전의 리소스 ID

HTTP 메서드 및 URL:

DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

요청을 보내려면 다음 옵션 중 하나를 펼칩니다.

cURL(Linux, macOS, Cloud Shell)

다음 명령어를 실행합니다.

curl -X DELETE \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"

PowerShell(Windows)

다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method DELETE `
    -Headers $headers `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID" | Select-Object -Expand Content

성공 상태 코드(2xx)와 빈 응답을 받게 됩니다.

배포된 에이전트 관리 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

배포된 에이전트 나열

콘솔

Python용 Vertex AI SDK

REST

cURL(Linux, macOS, Cloud Shell)

PowerShell(Windows)

배포된 에이전트 가져오기

콘솔

Python용 Vertex AI SDK

REST

cURL(Linux, macOS, Cloud Shell)

PowerShell(Windows)

배포된 에이전트 업데이트

콘솔

Python용 Vertex AI SDK

REST

cURL(Linux, macOS, Cloud Shell)

PowerShell(Windows)

배포된 에이전트의 원격 분석 구성

배포된 에이전트의 측정항목 보기

배포된 에이전트 삭제

콘솔

Python용 Vertex AI SDK

REST

cURL(Linux, macOS, Cloud Shell)

PowerShell(Windows)

다음 단계

배포된 에이전트 관리