Gemini Enterprise Agent Platform의 에이전트 모니터링 가능성은 배포된 에이전트와 모델 컨텍스트 프로토콜 (MCP) 서버의 성능, 동작, 상태에 대한 포괄적인 가시성을 제공합니다. 주요 측정항목을 모니터링하고, 실행 경로를 추적하고, 멀티 에이전트 시스템을 전체적으로 관찰하면 문제를 진단하고, 리소스 소비를 최적화하고, 에이전트의 안정성을 개선할 수 있습니다.
이 문서에서는 시스템 전체 토폴로지, 개별 에이전트 모니터링, MCP 서버 측정항목 등 Gemini Enterprise Agent Platform에서 사용할 수 있는 관측 가능성 도구를 간략하게 설명합니다.
원격 분석 설정
이러한 모니터링 가능성 대시보드, 토폴로지, 트레이스를 채우려면 에이전트가 OpenTelemetry 형식으로 Google Cloud Observability의 스토리지 시스템에 원격 분석 데이터를 전송하도록 구성해야 합니다.
에이전트 및 MCP 서버 환경이 이 데이터를 내보내도록 올바르게 구성되어 있는지 확인합니다. 내장 Google Cloud 구성요소는 OpenTelemetry 형식으로 원격 분석을 자동으로 내보냅니다. 예를 들어 Model Armor는 기본적으로 표준화된 원격 분석을 내보내므로 맞춤 계측 없이도 추적 데이터 내에서 직접 실시간 정책 차단을 원활하게 노출하고 모니터링할 수 있습니다.
에이전트 원격 분석 설정 안내 및 요구사항은 다음 리소스를 참고하세요.
- ADK로 빌드된 에이전트를 계측하려면 OpenTelemetry를 사용하여 ADK 애플리케이션 계측을 참고하세요.
- ADK로 빌드되지 않은 에이전트 런타임의 에이전트를 계측하려면 생성형 AI 애플리케이션 계측을 참고하세요.
- MCP 서버 원격 분석의 경우 Cloud Trace를 사용하여 MCP 도구 사용 모니터링을 참고하세요.
- Model Armor 원격 분석의 경우 Model Armor 로깅 구성을 참고하세요.
에이전트 토폴로지
멀티 에이전트 토폴로지 뷰는 멀티 에이전트 시스템 아키텍처의 시각적 시스템 전체 지도를 제공합니다. 에이전트 레지스트리에 알려진 모든 에이전트와 MCP 서버 간의 실시간 관계와 트래픽 흐름을 표시합니다. 이 집계된 보기를 사용하면 복잡한 종속성을 이해하고 생태계 전반의 잠재적인 병목 현상을 식별할 수 있습니다.
멀티 에이전트 토폴로지 뷰 외에도 단일 에이전트의 특정 인바운드 및 아웃바운드 종속 항목을 볼 수 있습니다. 이 단일 에이전트 토폴로지 보기는 선택한 에이전트의 추적 데이터를 기반으로 합니다.
에이전트 토폴로지 그래프를 탐색하고 해석하는 방법에 관한 자세한 안내는 에이전트 관계 및 토폴로지 보기를 참고하세요.
모니터링 가능성 신호
Gemini Enterprise 에이전트 플랫폼은 측정항목, 트레이스, 로그를 통해 관측 가능성을 제공합니다.
레지스트리에서 특정 에이전트를 선택하면 관측 가능성 탭에 운영 상태, 성능, 인프라 사용률을 모니터링할 수 있는 타겟팅된 대시보드 모음이 표시됩니다. 모니터링 가능성 탭의 왼쪽 탐색을 사용하여 다음 보기 간에 전환합니다.
- 개요: 선택한 기간의 개략적인 사용량을 추적합니다. 여기에는 총 세션 수, 세션당 평균 턴 수, 총 상담사 호출 수가 포함됩니다. 시계열 차트에는 토큰 사용량 (입력 대 출력), 전체 에이전트 트래픽 볼륨, 지연 시간 백분위수 (p50, p95, p99), 오류율이 표시됩니다.
- 평가: 지속적인 품질 평가를 위한 온라인 모니터를 표시합니다. 여기에는 평균 응답 품질, 안전 측정항목, 환각 발생률, 도구 사용 품질을 추적하는 시계열 위젯이 포함됩니다.
- 모델: 기본 파운데이션 모델별로 성능을 분류합니다. 특정 모델별로 격리된 p95 지연 시간, 총 호출 수, 오류율, 할당량 실패, 토큰 사용량을 모니터링할 수 있습니다.
- 도구: 에이전트에 연결된 외부 도구 및 서비스를 모니터링합니다. 이 뷰에는 도구별 p95 지연 시간, 호출 수, 오류율과 도구가 호출되지 않은 상호작용 빈도가 표시됩니다.
- 사용량: 컨테이너 CPU 할당, 컨테이너 메모리 할당, 토큰 사용량 등 에이전트의 런타임 환경에 관한 인프라 수준 측정항목을 제공합니다.
- 로그: 심각도, 타임스탬프, 심층 문제 해결을 위한 실행 요약을 비롯한 필터링 가능한 원시 에이전트 로그 스트림을 표시합니다. 자세한 내용은 에이전트 로그 보기를 참고하세요.
관측 가능성 탭의 대시보드 외에도 에이전트의 트레이스 탭을 사용하여 스팬 및 입력/출력의 방향성 비순환 그래프를 비롯한 특정 세션의 단계별 실행을 검사할 수 있습니다. 자세한 내용은 에이전트 트레이스 보기를 참고하세요. 토폴로지 탭을 사용하여 해당 단일 에이전트의 특정 인바운드 및 아웃바운드 종속 항목을 볼 수도 있습니다.
MCP 서버의 경우 요청 수와 p95 요청 기간을 모니터링하여 사용률과 응답성을 추적할 수 있습니다.
OpenTelemetry 생성형 AI 규칙
에이전트 추적 및 프롬프트-응답 로그는 생성형 AI 시스템의 OpenTelemetry 시맨틱 규칙을 사용하여 생성형 AI 원격 분석이 캡처, 구조화, 보고되는 방식을 표준화합니다.
이러한 규칙을 준수하는 것은 에이전트 추적에 매우 중요합니다. 도구 실행, 검색 단계, 토큰 소비와 같은 복잡한 다단계 에이전트 워크플로를 설명하기 위한 보편적이고 공급업체에 구애받지 않는 형식을 설정하기 때문입니다. 이 표준화를 통해 Google Cloud내부와 외부 모두에서 다양한 모니터링 가능성 백엔드와 분석 도구 간의 원활한 상호 운용성이 지원됩니다.
다음 단계
- 에이전트 관계를 토폴로지 그래프로 확인합니다.
- 에이전트 트레이스 보기를 통해 에이전트 동작을 디버그합니다.
- 에이전트 평가