에이전트 AI 사용 사례: 멀티모달 데이터 분류

Last reviewed 2026-03-03 UTC

이 문서에서는 Cloud Run에 배포되어 다양한 멀티모달 데이터를 분석하고 신뢰도가 높은 분류를 생성하는 멀티 에이전트 AI 시스템의 대략적인 아키텍처를 제공합니다. 이 접근 방식은 실시간 데이터를 이전 정답과 일치시켜 단편적인 미디어를 교차 검증하여 근거가 있고 검증 가능한 통계를 생성합니다.

이 문서의 주요 대상에는 클라우드에서 AI 인프라 및 애플리케이션을 빌드하고 관리하는 설계자, 개발자, 관리자가 포함됩니다. 이 문서에서는 사용자가 AI 에이전트 및 모델에 대한 기본적인 이해를 갖추고 있다고 가정합니다. 이 문서에서는 AI 에이전트 설계 및 코딩에 관한 구체적인 안내를 제공하지 않습니다.

이 문서의 배포 섹션에는 멀티 에이전트 AI 시스템을 빌드하고 배포하는 방법을 알아보는 데 사용할 수 있는 코드 샘플이 나와 있습니다.

아키텍처

다음 다이어그램은 멀티모달 데이터에 대한 독립적인 분석을 조정하여 단일 분류를 생성하는 병렬 에이전트 설계 패턴 을 사용하는 멀티 에이전트 AI 시스템의 아키텍처를 보여줍니다.

멀티모달 데이터를 분류하는 멀티 에이전트 AI 시스템의 아키텍처

아키텍처는 다음과 같은 데이터 흐름을 보여줍니다.

  1. 웹 애플리케이션은 분류를 위해 멀티모달 데이터 세트를 분석하도록 루트 에이전트에 요청을 보냅니다. 루트 에이전트는 요청을 수신하고 Cloud Run 서비스에 배포되는 코디네이터 에이전트입니다.
  2. 루트 에이전트는 다음과 같은 방식으로 요청을 처리합니다.
    1. 루트 에이전트는 before_agent_callback 을 시작하여 환경 구성을 수집하고, 사용자 입력을 검증하고, 공유 세션 상태에 리소스 경로를 저장합니다 . 모든 하위 에이전트는 공유 세션 상태에 액세스할 수 있으므로 상태 데이터를 가져오는 중복 호출이 제거되고 전반적인 지연 시간이 줄어듭니다.
    2. 루트 에이전트는 Vertex AI의 Gemini를 사용하여 사용자 요청을 해석하고 병렬로 실행되는 전문 하위 에이전트에 작업을 분산합니다.
  3. 각 하위 에이전트는 특정 도메인을 전문으로 하며 다음과 같은 작업을 독립적으로 수행합니다.
    1. 이미지 및 동영상 분석가 하위 에이전트는 커스텀 모델 컨텍스트 프로토콜 (MCP) 서버와 상호작용하여 다음 작업을 수행합니다.
      1. Cloud Storage 버킷에 저장된 구조화되지 않은 원시 데이터를 가져옵니다.
      2. Gemini에 입력 데이터를 해석하고, 데이터를 분류하고, 신뢰도 수준을 계산하도록 요청을 보냅니다.
      3. Gemini는 제안된 분류 및 신뢰도 수준을 커스텀 MCP 서버로 다시 보냅니다.
      4. 커스텀 MCP 서버는 응답을 하위 에이전트로 다시 전달합니다.
    2. 구조화된 데이터 분석가 하위 에이전트는 다음 작업을 완료하여 분석을 조정합니다.
      1. BigQuery MCP 서버와 상호작용하여 BigQuery 데이터 세트에 저장된 구조화된 컨텍스트 데이터 (예: 이전 기록, 이벤트 로그, 센서 판독값)를 가져옵니다.
      2. 구조화된 데이터 분석가는 Gemini에 입력 데이터를 해석하고, 데이터를 분류하고, 신뢰도 수준을 계산하도록 요청을 보냅니다.
      3. Gemini는 제안된 분류 및 신뢰도 수준을 하위 에이전트로 다시 보냅니다.
  4. 각 하위 에이전트는 제안된 분류 및 신뢰도 수준을 루트 에이전트로 다시 보냅니다.
  5. 루트 에이전트는 Gemini를 사용하여 전문 하위 에이전트의 출력을 요약하여 신뢰도가 높은 단일 분류를 생성합니다.
    • 전문 하위 에이전트의 분류 대부분이 일치하면 루트 에이전트는 일치하는 분류를 웹 애플리케이션으로 보냅니다.
    • 하위 에이전트가 일치하는 분류를 제공하지 않으면 루트 에이전트는 신뢰도 수준이 가장 높은 분류를 선택하여 웹 애플리케이션으로 보냅니다.

사용 제품

이 참조 아키텍처에는 다음과 같은 Google Cloud 제품 및 도구가 사용됩니다.

  • Cloud Run: Google의 확장 가능한 인프라에서 직접 컨테이너를 실행할 수 있게 해주는 서버리스 컴퓨팅 플랫폼입니다.
  • Vertex AI: ML 모델 및 AI 애플리케이션을 학습 및 배포하고 AI 기반 애플리케이션에서 사용하도록 LLM을 맞춤설정할 수 있게 해주는 ML 플랫폼입니다.
  • Gemini: Google에서 개발한 멀티모달 AI 모델 제품군입니다.
  • BigQuery: 머신러닝 지리 정보 분석 및 비즈니스 인텔리전스와 같은 기본 제공 기능으로 데이터를 관리 및 분석하는 데 도움이 되는 엔터프라이즈 데이터 웨어하우스입니다.
  • Cloud Storage: 다양한 데이터 유형에 적합한 저비용, 무제한 객체 스토어입니다. 내부 및 외부에서 데이터에 액세스할 수 있고 Google Cloud중복성을 위해 여러 위치에 복제됩니다.
  • Google Cloud MCP 서버: 모델 컨텍스트 프로토콜 (MCP)을 구현하여 AI 애플리케이션이 Google 및 Google Cloud 제품과 서비스에 액세스할 수 있도록 하는 Google 관리형 원격 서비스입니다.
  • 모델 컨텍스트 프로토콜 (MCP): AI 애플리케이션을 외부 시스템에 연결하기 위한 오픈소스 표준입니다.
  • 에이전트 개발 키트 (ADK): AI 에이전트를 개발, 테스트, 배포하기 위한 도구 및 라이브러리 세트입니다.

프레임워크, 에이전트 런타임, 도구, 메모리, 설계 패턴을 비롯한 에이전트 AI 시스템의 대체 구성요소를 선택하는 방법에 대한 자세한 내용은 다음 항목을 참조하세요. 에이전트 AI 아키텍처 구성요소 선택

사용 사례

이 아키텍처는 분류 및 감지 작업을 위해 다양한 멀티모달 데이터를 합성하는 사용 사례를 위해 설계되었습니다. 정확성과 확장성을 높이기 위해 이 아키텍처는 모놀리식 단일 에이전트 접근 방식 대신 멀티 에이전트 AI 시스템을 사용합니다. 이 설계 패턴은 집중적인 안내를 제공하고, 상충되는 지시어를 피하고, 더 빠른 결정을 위해 더 작은 도구 세트를 사용 설정하고, 독립적인 업데이트를 지원하므로 더 강력하고 정교한 결과를 얻을 수 있습니다.

다음은 이 문서에 설명된 아키텍처의 사용 사례 예시입니다.

  • 의료 진단: 전문 에이전트를 배포하여 의료 영상, 환자 증상, 실험실 결과를 독립적으로 분석함으로써 포괄적인 진단 평가를 제공합니다. AI 시스템은 결정된 신뢰도 기준점을 기반으로 이러한 결과를 요약하여 의료진에게 근거가 있고 검증 가능한 통계를 제공합니다.
  • 사기 감지: 에이전트를 배포하여 사용자 행동 패턴과 스캔한 영수증 및 판매자 인보이스와 같은 거래 데이터를 독립적으로 분석함으로써 잠재적인 사기를 감지하고 신고합니다. 문서의 시각적 증거를 디지털 네트워크 활동과 교차 참조하여 시스템은 불일치를 식별하고 단일 에이전트가 의심스러운 지표를 식별하는 거래에 플래그를 지정합니다.
  • 문서 처리: 광학 문자 인식 (OCR), 문서 분류, 데이터 추출을 위한 전문 에이전트를 배포하여 문서에서 정보를 분류하고 추출하는 작업을 자동화합니다. 신뢰도가 높은 처리를 지원하려면 AI 시스템에서 모든 에이전트가 출력에 동의해야 합니다.
  • 품질 관리: 시각적 검사, 센서 데이터 분석, 사양 확인을 위한 전문 에이전트를 배포하여 제품 품질을 분류하거나 이상을 감지합니다. 시스템은 에이전트 간에 결정된 신뢰도 기준점을 기반으로 합격 또는 불합격을 결정합니다.

설계 고려사항

프로덕션에 이 아키텍처를 구현하려면 다음 권장사항을 고려하세요.

설계 요소 및 권장사항에 관한 정보와 멀티 에이전트 AI 시스템 빌드 및 배포에 관한 권장사항은 의 멀티 에이전트 AI 시스템을 참조하세요. Google Cloud

배포

이 아키텍처의 샘플 구현을 배포하려면 Way Back Home Level 1 Codelab을 사용해 보세요.

다음 단계

참여자

저자: 사만다 헤 | 테크니컬 라이터

기타 참여자: