エージェント AI のユースケース: マルチモーダル データを分類する

Last reviewed 2026-03-03 UTC

このドキュメントでは、Cloud Run にデプロイされたマルチエージェント AI システムのハイレベルなアーキテクチャについて説明します。このシステムは、異なるマルチモーダル データを分析し、信頼度の高い分類を生成します。このアプローチでは、ライブデータを過去のグラウンド トゥルースと照合して、断片的なメディアを相互検証し、根拠のある検証可能な分析情報を作成します。

このドキュメントは、クラウドで AI インフラストラクチャとアプリケーションを構築して管理するアーキテクト、デベロッパー、管理者を対象としています。このドキュメントでは、AI エージェントとモデルの基本的な知識があることを前提としています。このドキュメントでは、AI エージェントの設計とコーディングに関する具体的なガイダンスは提供していません。

このドキュメントのデプロイ セクションでは、マルチエージェント AI システムを構築してデプロイする方法を学習するために使用できるコードサンプルを 示します。

アーキテクチャ

次の図は、並列エージェント設計パターンを使用してマルチモーダル データの独立した分析を調整し、単一の分類を生成するマルチエージェント AI システムのアーキテクチャを示しています。

マルチモーダル データを分類するマルチエージェント AI システムのアーキテクチャ。

このアーキテクチャは、次のデータフローを示しています。

  1. ウェブ アプリケーションは、分類のために一連のマルチモーダル データを分析するリクエストをルート エージェントに送信します。ルート エージェントは、 リクエストを受信し、 Cloud Run サービスにデプロイされるコーディネーター エージェントです。
  2. ルート エージェントは、次の方法でリクエストを処理します。
    1. ルート エージェントは before_agent_callback を開始して、環境構成を収集し、ユーザー入力を検証し、リソース パスを共有 セッション状態に保存します。すべてのサブエージェントが共有セッション状態にアクセスできるため、状態データを取得するための冗長な呼び出しが不要になり、全体的なレイテンシが短縮されます。
    2. ルート エージェントは Vertex AI の Gemini を使用して、ユーザーのリクエストを解釈し、並行して実行される専門のサブエージェントにタスクを分散します。
  3. 各サブエージェントは特定のドメインに特化しており、次のタスクを独立して実行します。
    1. 画像と動画のアナリスト サブエージェントは、カスタム Model Context Protocol(MCP)サーバーと連携して 次のアクションを実行します。
      1. Cloud Storage バケットに保存されている未加工の非構造化データを取得します。
      2. Gemini にリクエストを送信して、入力データを解釈し、データを分類して、信頼レベルを計算します。
      3. Gemini は、推奨される分類と信頼レベルをカスタム MCP サーバーに返します。
      4. カスタム MCP サーバーは、レスポンスをサブエージェントに転送します。
    2. 構造化データ アナリスト サブエージェントは、次のタスクを完了して分析を調整します。
      1. BigQuery MCP サーバーと連携して、BigQuery データセットに保存されている構造化されたコンテキスト データ(履歴レコード、イベントログ、センサーの読み取りなど)を取得します。
      2. 構造化データ アナリストは、Gemini にリクエストを送信して、入力データを解釈し、データを分類して、信頼レベルを計算します。
      3. Gemini は、推奨される分類と信頼レベルをサブエージェントに返します。
  4. 各サブエージェントは、推奨される分類と信頼レベルをルート エージェントに返します。
  5. ルート エージェントは Gemini を使用して、専門のサブエージェントからの出力を要約し、信頼度の高い単一の分類を生成します。
    • 専門のサブエージェントからの分類の大部分が一致する場合、ルート エージェントは一致した分類をウェブ アプリケーションに送信します。
    • サブエージェントが一致する分類を提供しない場合、ルート エージェントは信頼レベルが最も高い分類を選択してウェブ アプリケーションに送信します。

使用するプロダクト

このリファレンス アーキテクチャでは、次の Google Cloud プロダクトとツールを使用します。

  • Cloud Run: Google のスケーラブルなインフラストラクチャ上で コンテナを直接実行できるマネージド コンピューティング プラットフォーム。
  • Vertex AI: ML モデル と AI アプリケーションのトレーニングとデプロイを行い、AI を活用したアプリケーションで使用する LLM をカスタマイズできる ML プラットフォーム。
  • Gemini: Google が開発したマルチモーダル AI モデルのファミリー。
  • BigQuery: ML、地理空間分析、ビジネス インテリジェンスなどの組み込み機能を使用してデータの管理と 分析を支援する、Google Cloud のフルマネージド エンタープライズ データ ウェアハウス。
  • Cloud Storage: 低コストで無制限のオブジェクト ストア。さまざまなデータ型に対応しています。 データには の内部および外部からアクセスでき Google Cloud、冗長性を確保するために複数のロケーションに複製されます 。
  • Google Cloud MCP サーバー: Model Context Protocol (MCP)を実装して、AI アプリケーションが Google と Google Cloud のプロダクトとサービスにアクセスできるようにする、Google マネージドのリモート サービス。
  • Model Context Protocol(MCP): AI アプリケーションを外部 システムに接続するためのオープンソース標準。
  • Agent Development Kit(ADK): AI エージェントを 開発、テスト、デプロイするためのツールとライブラリのセット。

フレームワーク、エージェント ランタイム、ツール、メモリ、設計パターンなど、エージェント AI システムの代替コンポーネントを選択する方法については、 次を参照してください。 エージェント AI アーキテクチャのコンポーネントを選択する

ユースケース

このアーキテクチャは、分類タスクと検出タスクのために多様なマルチモーダル データを合成するユースケース向けに設計されています。精度とスケーラビリティを向上させるため、このアーキテクチャでは、モノリシックな単一エージェント アプローチではなく、マルチエージェント AI システムを使用します。この設計パターンでは、焦点を絞った指示を提供し、競合するディレクティブを回避し、より迅速な意思決定のためにツールセットを小さくし、独立した更新をサポートします。これにより、より堅牢で洗練された結果が得られます。

このドキュメントで説明するアーキテクチャのユースケースの例を次に示します。

  • 医療診断: 専門のエージェントを デプロイして、医用画像、患者の 症状、検査結果を個別に分析することで、包括的な診断評価を提供します。AI システムは、決定された信頼しきい値に基づいてこれらの結果を要約し、臨床医に根拠のある検証可能な分析情報を提供します。
  • 不正検出: エージェントをデプロイして、ユーザーの行動パターンや、スキャンした領収書や販売者の請求書などのトランザクション データを個別に分析することで、不正の可能性を検出してフラグを設定します。ドキュメントの視覚的な証拠とデジタル ネットワーク アクティビティを相互参照することで、システムは不一致を特定し、単一のエージェントが疑わしい指標を特定した取引にフラグを設定します。
  • ドキュメント処理: 光学文字認識(OCR)、ドキュメント分類、データ抽出用の専門エージェントをデプロイして、ドキュメントからの情報の分類と抽出を自動化します。信頼度の高い処理をサポートするには、AI システムですべてのエージェントが出力に同意する必要があります。
  • 品質検証(QC): 外観検査、センサーデータ分析、仕様チェック用の専門エージェントをデプロイして、製品の品質を分類したり、異常を検出したりします。システムは、エージェント間の信頼しきい値に基づいて合格または不合格を判断します。

設計上の考慮事項

本番環境にこのアーキテクチャを実装するには、次の推奨事項を考慮してください。

設計要因とベスト プラクティス、マルチエージェント AI システムの構築とデプロイに関する推奨事項については、 の マルチエージェント AI システム Google Cloudをご覧ください。

デプロイ

このアーキテクチャのサンプル実装をデプロイするには、 Way Back Home Level 1 Codelab をお試しください。

次のステップ

寄稿者

著者: Samantha He | テクニカル ライター

その他の寄稿者:

  • Amina Mansour | Cloud Platform 評価チーム リーダー
  • Andrey Shakirov | Google Cloud ソリューション アーキテクト
  • Ayo Adedeji | デベロッパー リレーションズ エンジニア
  • Christina Lin | デベロッパー リレーションズ エンジニア マネージャー
  • Kumar Dhanagopal | クロス プロダクト ソリューション デベロッパー
  • Ryan Pei | Google Cloud プロダクト マネージャー