エージェント AI のユースケース: データ サイエンス ワークフローを自動化する

このドキュメントでは、データ サイエンス ワークフローを実行して複雑なデータ分析と ML タスクを自動化するアプリケーションのアーキテクチャの概要について説明します。

このアーキテクチャでは、BigQuery または AlloyDB for PostgreSQL でホストされているデータセットを使用します。このアーキテクチャは、ユーザーが自然言語コマンドでアクションを実行できるマルチエージェント システムであり、複雑な SQL コードや Python コードを記述する必要がなくなります。

このドキュメントは、エージェント AI アプリケーションを構築して管理するアーキテクト、デベロッパー、管理者を対象としています。このアーキテクチャを使用すると、ビジネスチームとデータチームは、小売、金融、製造など、さまざまな業界の指標を分析できます。このドキュメントは、エージェント AI システムの基本的な知識があることを前提としています。エージェントと非エージェント システムの違いについては、AI エージェント、AI アシスタント、ボットの違いは何ですか?をご覧ください。

このドキュメントのデプロイ セクションには、データ サイエンス ワークフローを実行するエージェント AI アプリケーションのデプロイを試すためのコードサンプルへのリンクが記載されています。

アーキテクチャ

次の図は、データ サイエンス ワークフロー エージェントのアーキテクチャを示しています。

データ サイエンス ワークフロー エージェントのアーキテクチャ。

このアーキテクチャには次のコンポーネントが含まれています。

コンポーネント 説明
フロントエンド ユーザーは、サーバーレスの Cloud Run サービスとして実行されるチャット インターフェースなどのフロントエンドを介して、マルチエージェント システムとやり取りします。
エージェント このアーキテクチャでは、次のエージェントを使用します。
  • ルートエージェント: フロントエンド サービスからリクエストを受け取るコーディネーター エージェント。ルート エージェントはユーザーのリクエストを解釈し、リクエストの解決を試みます。タスクに特別なツールが必要な場合、ルートエージェントはリクエストを適切な専門エージェントに委任します。
  • 専門エージェント: ルート エージェントは、ツールとしてのエージェント機能を使用して、次の専門エージェントを呼び出します。
    • 分析エージェント: データ分析と可視化のための専門エージェント。分析エージェントは、AI モデルを使用して Python コードを生成して実行し、データセットの処理、グラフの作成、統計分析の実行を行います。
    • AlloyDB for PostgreSQL エージェント: AlloyDB for PostgreSQL のデータとやり取りするための専用エージェント。エージェントは AI モデルを使用してユーザーのリクエストを解釈し、PostgreSQL 言語で SQL を生成します。エージェントは、MCP Toolbox for Databases を使用してデータベースに安全に接続し、クエリを実行してリクエストされたデータを取得します。
    • BigQuery エージェント: BigQuery のデータとやり取りするための専用エージェント。エージェントは AI モデルを使用してユーザーのリクエストを解釈し、GoogleSQL クエリを生成します。エージェントは、Agent Development Kit(ADK)の組み込み BigQuery ツールを使用してデータベースに接続し、クエリを実行してリクエストされたデータを取得します。
  • BigQuery ML エージェント: ML ワークフロー専用のルート エージェントのサブエージェント。エージェントは BigQuery ML と連携して、エンドツーエンドの ML ライフサイクルを管理します。エージェントは、モデルの作成とトレーニング、評価の実行、ユーザー リクエストに基づく予測の生成を行うことができます。
エージェント ランタイム このアーキテクチャの AI エージェントは、サーバーレスの Cloud Run サービスとしてデプロイされます。
ADK ADK には、エージェントの開発、テスト、デプロイを行うためのツールとフレームワークが用意されています。ADK はエージェント作成の複雑さを抽象化し、AI デベロッパーがエージェントのロジックと機能に集中できるようにします。
AI モデルとモデル ランタイム このアーキテクチャ例では、推論サービングに Vertex AI の最新の Gemini モデルを使用します。

使用するプロダクト

このアーキテクチャ例では、次の Google Cloud プロダクトとオープンソース プロダクトおよびツールを使用します。

  • Cloud Run: Google のスケーラブルなインフラストラクチャ上でコンテナを直接実行できるマネージド コンピューティング プラットフォーム。
  • Agent Development Kit(ADK): AI エージェントの開発、テスト、デプロイを行うためのツールとライブラリのセット。
  • Vertex AI: ML モデルと AI アプリケーションのトレーニングとデプロイを行い、AI を活用したアプリケーションで使用する LLM をカスタマイズできる ML プラットフォーム。
  • Gemini: Google が開発したマルチモーダル AI モデルのファミリー。
  • BigQuery: ML、地理空間分析、ビジネス インテリジェンスなどの組み込み機能を使用してデータの管理と分析を支援する、Google Cloud のフルマネージド エンタープライズ データ ウェアハウス。
  • AlloyDB for PostgreSQL: トランザクションと分析のハイブリッド処理など、特に要求の厳しいワークロード向けに設計された、PostgreSQL 対応のフルマネージド データベース サービス。
  • データベース向け MCP ツールボックス: 接続プーリング、認証、オブザーバビリティなどのデータベースの複雑さを管理することで、AI エージェントがデータベースに安全に接続できるようにするオープンソースの Model Context Protocol(MCP)サーバー。

デプロイ

このアーキテクチャのサンプル実装をデプロイするには、複数のエージェントによるデータ サイエンスを使用します。このリポジトリには、システムの柔軟性を示す 2 つのサンプル データセット(運用分析用のフライト データセットと、ビジネス分析用の e コマース販売データセット)が用意されています。

次のステップ

寄稿者

著者: Samantha He | テクニカル ライター

その他の寄稿者: