Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

会話型分析の概要

BigQuery の会話型分析では、自然言語を使用してデータについてエージェントとチャットできます。データに関する回答を得るには、次の操作を行います。

選択したテーブル、ビュー、グラフ、ユーザー定義関数（UDF）などのナレッジソースのセットに対して、データコンテキストとクエリ処理の指示を自動的に定義するデータエージェントを作成します。
必要に応じて、カスタムテーブルとフィールドのメタデータ、データを解釈してクエリを実行するためのエージェントへの指示の形式で、エージェントのコンテキストと指示を作成できます。また、検証済みクエリ（以前はゴールデンクエリと呼ばれていました）を作成して、特定のユースケースの質問に対してデータエージェントが効果的に回答するように構成することもできます。

エージェントをカスタマイズする前に、エージェントが作成するコンテキストと指示を使用することをおすすめします。

エージェントに提供するコンテキストと指示の例を次に示します。

コンテキスト 。売上分析用のデータエージェントは、「トップパフォーマー」が成約数の多い営業担当者ではなく、収益が最も高い営業担当者を指すことを理解するように構成できます。
指示。「トレンド」について質問されたときに、常に最新の四半期にデータをフィルタするよう、またはデフォルトで「商品カテゴリ」で結果をグループ化するよう、データエージェントに指示できます。

データエージェントを作成したら、会話を通じて自然言語を使用して BigQuery データに関する質問をすることができます。また、1 つ以上のデータソースとの直接会話を作成して、基本的な単発の質問に回答することもできます。

会話型分析は Gemini for Google Cloud を基盤としており、一部の BigQuery ML 関数をサポートしています。詳細については、BigQuery ML のサポートをご覧ください。

Gemini for がデータを使用する方法とタイミングに関する説明をご覧ください。 Google Cloud

データエージェント

データエージェントは、1 つ以上のナレッジソースと、そのデータを処理するためのユースケース固有の指示のセットで構成されています。データエージェントを作成するときに、次のオプションを使用して構成できます。

テーブル、ビュー、UDF などのナレッジソースをデータエージェントで使用します。 Lakehouse テーブルをソースとして接続することもできます。詳細については、自然言語で Lakehouse データにクエリを実行するをご覧ください。
特定のユースケースに最適な形でデータを記述するカスタムテーブルとフィールドのメタデータを提供します。
データの解釈とクエリ処理に関する指示を提供します。たとえば、次のものを定義します。
- フィールド名の類義語とビジネス用語
- フィルタリングとグループ化の最も重要なフィールドとデフォルト
データエージェントがエージェントのレスポンス構造を形成し、組織で使用されるビジネスロジックを学習するために使用できる検証済みクエリを作成します。検証済みクエリは、以前はゴールデンクエリと呼ばれていました。検証済みクエリでは、サポートされている BigQuery ML 関数を使用でき、クエリパラメータをサポートしています。
エージェントごとに BigQuery カスタム用語集の用語を作成するか、Knowledge Catalog からビジネス用語集の用語をインポートします。これらの用語は、エージェントがユーザープロンプトを解釈するのに役立ちます。各タイプを使用するタイミングについては、用語集の用語を作成または確認するをご覧ください。

データエージェントを管理する

コンソールの Google Cloud [エージェントカタログ]タブで、次の種類のデータエージェントを作成、管理、操作できます。

プロジェクトごとに事前定義されたサンプルエージェント。 Google Cloud
下書き、作成、公開したエージェントのリスト。
他のユーザーが作成して共有したエージェントのリスト。

詳細については、データエージェントを作成するをご覧ください。

Conversational Analytics API やデータポータルなど、データエージェントをサポートするプロジェクト内の他のサービスは、BigQuery で作成したデータエージェントにアクセスできます。また、 Conversational Analytics API を使用して呼び出すことで、 Google Cloud コンソールで作成したエージェントにアクセスすることもできます。

会話

会話とは、データエージェントまたはデータソースとの永続化されたチャットです。ユーザーは、テーブルフィールド名を指定したり、データのフィルタ条件を定義したりすることなく、「売上」や「最も人気がある」といった一般的な言葉を使用してデータエージェントにマルチパートの質問をすることができます。PDF などのオブジェクトにあるデータについて質問することもできます。

返されるチャットレスポンスには、次の機能があります。

質問に対する回答（テキスト、コード、画像（マルチモーダル））。回答には、サポートされている BigQuery ML 関数を含めることができます。
必要に応じて生成されたグラフ。
GQL クエリパスのグラフビジュアリゼーション。
結果の背後にあるエージェントの推論。
使用されたエージェントやデータソースなど、会話に関するメタデータ。

データソースとの直接会話を作成すると、 Conversational Analytics API は、データエージェントから提供されるコンテキストと処理の指示を使用せずにユーザーからの質問を解釈します。そのため、直接会話の結果は正確さが低い可能性があります。正確さが求められる場合は、データエージェントを使用してください。

コンソールを使用して、BigQuery で会話を作成して管理できます。Google Cloud 詳細については、会話でデータを分析するをご覧ください。

BigQuery AI と ML のサポート

会話型分析は、データエージェントとデータソースとのチャットに対するレスポンスと、作成した検証済み SQL クエリで、次の AI 関数をサポートしています。

生成 AI クエリを実行するには、必要な権限が必要です。

エージェントは、自律型エンベディング生成が有効になっているテーブルでのみ AI.SEARCH 関数を使用します。それ以外の場合、エージェントは AI.SIMILARITY 関数を使用します。この関数では、リアルタイムのエンベディング生成が必要です。

ユースケース

サポートされている関数を有効にするには、次の方法で使用します。

エージェントを作成して検証済みクエリを追加する場合（たとえば、定期的なレポートを作成するデータサイエンティストの場合）、検証済みクエリでサポートされている AI 関数を使用してデフォルトを記述し、レポートを自動化できます。
会話または検証済みクエリでキーワードを使用して、データに関する高度な質問をエージェントにすると、エージェントは質問に対するレスポンスとして SQL を生成します。

次の表に、AI 関数または ML 関数の使用を有効にするワンショットプロンプトの例を示します。

ユースケース	使用例	一般公開データセット
予測	「来月の乗車数を予測してください。」	`bigquery-public-data.san_francisco_bikeshare.bikeshare_trips`
異常検出	「2017 年を基準として、2018 年の 1 日あたりの乗車数の外れ値を見つけてください。」	`bigquery-public-data.san_francisco_bikeshare.bikeshare_trips`
主な訴求点	「2017 年と 2018 年の乗車数の変化の主な訴求点を特定してください。」	`bigquery-public-data.austin_bikeshare.bikeshare_trips`
LLM テキスト生成	「「スポーツ」カテゴリの記事ごとに、本文列を 1 ～ 2 文で要約してください。」	`bigquery-public-data.bbc_news.fulltext`
セマンティックフィルタリング	「テクノロジーカテゴリの記事で、人工知能のブレークスルーについて説明している記事をフィルタしてください。」	`bigquery-public-data.bbc_news.fulltext`
セマンティックスコアリング	「エンターテイメントカテゴリの記事について、肯定的な感情の度合いを示す評価を提供してください。」	`bigquery-public-data.bbc_news.fulltext`
セマンティック分類	「各レビューに、レビュー担当者の主な焦点（演技、プロット、撮影、演出、その他）のタグを付けます。」	`bigquery-public-data.imdb.reviews`
セマンティック検索	「「緊張感のある心理スリラー」に最も近い上位 5 件のレビューを見つけてください。」	`bigquery-public-data.imdb.reviews`

グラフのサポート

会話型分析では、グラフをデータソースとして使用できます。グラフについて質問すると、エージェントは GQL クエリまたは SQL クエリを作成して回答します。エージェントは、グラフのラベルとプロパティで定義した説明と類義語を使用して、結果の品質を向上させることができます。また、エージェントはグラフで定義された指標を利用して、マルチレベル集計を実行することもできます。レスポンスにグラフパスが含まれている場合は、グラフビジュアリゼーションが提供されます。

たとえば、BigQuery の Look Graph サンプルエージェントを使用して、 [エージェント] ページの bigquery-public-data.thelook_ecommerce.graph グラフについて次のような質問をすることができます。

Which product is most popular among 25-year-olds?
Show me the connection between bow tie orders and distribution centers

グラフをデータソースとして使用する場合は、次の制限事項が適用されます。

エージェントまたは会話ごとに、データソースとして使用できるグラフは 1 つまでです。
テーブルとグラフをデータソースとして組み合わせることはできません。

セキュリティ

BigQuery の会話型分析へのアクセスは、 Conversational Analytics API の IAM ロールと権限を使用して管理できます。特定の操作に必要なロールについては、データエージェントに必要なロールと会話に必要なロールをご覧ください。

ロケーション

会話型分析はグローバルに運用されており、使用するリージョンを選択することはできません。

料金

データエージェントを作成し、データエージェントまたはデータソースと会話するときに実行されるクエリに対して、BigQuery のコンピューティング料金が発生します。プレビュー期間中は、データエージェントおよび会話の作成と使用に対して追加料金はかかりません。

ベストプラクティス

Conversational Analytics API を使用する際のベストプラクティスについては、次のガイドをご覧ください。

プロジェクトレベル、ユーザーレベル、クエリレベルで利用上限を設定して、エージェントの費用を管理します。
会話で効果的な質問をします。
データエージェントと会話のデータの保持と削除の仕組みを理解します。

制限事項

クエリ、会話、データ、ビジュアリゼーションの制限事項について詳しくは、 Conversational Analytics API の既知の制限事項をご覧ください。

動的共有割り当て

Gemini Enterprise Agent Platform の動的共有割り当て（DSQ）は、Gemini モデルの容量を管理します。従来の割り当てとは異なり、DSQ では、モデルのスループットに対するプロジェクトごとの固定上限なしで、リソースの大きな共有プールにアクセスできます。

レイテンシなどのパフォーマンスは、システム全体の負荷によって異なる場合があります。共有プール全体で需要が高い場合は、一時的に 429 Resource Exhausted エラーが発生することがあります。これらのエラーは、共有プールの容量が一時的に制限されていることを示しますが、プロジェクトで特定の割り当て上限に達したことを示すものではありません。容量を確認するには、しばらく待ってからリクエストを再試行してください。

エージェントが生成したクエリを特定して分析する

データエージェントによって実行される BigQuery ジョブには、特定のラベルが含まれます。これらのラベルを使用すると、エージェントのジョブを特定、フィルタ、分析できます。

これらのラベルは、次のタスクに使用できます。

ラベルで請求レポートをフィルタして、エージェントの費用を把握します。
エージェントのアクティビティを監査します。
クエリパフォーマンスを分析します。

コンソールでデータエージェントのラベルを特定する Google Cloud

BigQuery は、データエージェントによって実行されるジョブにラベルを適用します。フィルタリングやその他の分析に使用するラベルキーを取得するには、コンソールでラベルキーを表示します。 Google Cloud

データエージェントのラベルキーを表示する手順は次のとおりです。

コンソールで、ジョブの詳細を表示します。 Google Cloud
In the [クエリジョブの詳細] ペインで、[ラベル] セクションを見つけて、 ca で始まるラベル（ca-bq-job: true など）を探します。

エージェントが生成したジョブを分析する

ラベルを使用して、エージェントが生成したジョブを分析します。たとえば、データエージェントによって実行されたジョブの数を確認するには、ビューに対して次のクエリを実行します。INFORMATION_SCHEMA.JOBS

SELECT
  COUNT(*) AS job_count
FROM
  `PROJECT_ID`.`region-REGION`.INFORMATION_SCHEMA.JOBS
WHERE
  EXISTS (
    SELECT 1
    FROM UNNEST(labels) AS label
    WHERE label.key = 'ca-bq-job' AND label.value = 'true'
  );

次のように置き換えます。

PROJECT_ID: 実際の Google Cloud プロジェクト ID。
REGION: ジョブが実行されるリージョン（us、eu など）。

次のステップ

Conversational Analytics API について詳細を確認する。
データエージェントを作成する。
会話でデータを分析する。
Lakehouse で会話型分析を使用する
ラベルを使用してリソースをフィルタする方法を学習する。