このガイドでは、BigQuery の会話分析を使用して、自然言語プロンプトで BigLake テーブルのデータにクエリを実行する方法について説明します。BigLake を活用することで、BigLake 内の独自のデータを標準の BigQuery テーブルのように操作できます。Google Cloud
会話分析の仕組み
会話分析では、大規模言語モデル(LLM)を使用して、自然言語の質問を理解し、BigLake テーブルのスキーマにマッピングします。 プロセスは次の手順で行われます。
- スキーマ検出: システムは BigLake メタストアからメタデータを取得して、テーブル構造、列名、データ 型を把握します。
- SQL の生成: LLM は、 BigQuery エンジンと基盤となるデータ形式と互換性のある SQL クエリを生成します。
- 実行: BigQuery は、生成された SQL クエリを BigLake のオープン形式データに対して 直接実行します。
- レスポンス: 結果は会話インターフェースに返されます。 多くの場合、概要や可視化が伴います。
データ エージェントの管理、料金、ベスト プラクティスなど、会話分析の詳細については、会話分析の概要をご覧ください。
サポートされているファイル形式
会話分析では、自然言語の質問が SQL クエリに変換されます。BigLake メタストアでサポートされているオープン テーブル形式( Apache Iceberg テーブルなど)がサポートされています。
始める前に
データにクエリを実行する前に、外部テーブルを BigLake メタストアに登録します。BigLake メタストアは、BigQuery Studio を外部のオープン形式データに接続する統合ハブとして機能します。接続すると、テーブルは BigQuery 内で検出可能なアセットになります。
会話分析でテーブルにクエリを実行する
コンソールで、 Google Cloud BigQuery Studio エージェント ハブ に移動します。
データ エージェント を作成するか、既存のデータ エージェントとの直接会話を開始します。
BigLake テーブルを選択します 。
BigLake メタストアは、これらすべての異なる形式を統合するため、検出エクスペリエンスは標準の BigQuery テーブルの検索と同じです。
検索: ナレッジソースを追加するときに、テーブルの検索と選択のインターフェースでテーブル名を検索します。検索キーワードを使用して、次のような結果をフィルタできます。
TABLE_NAMEcatalog: CATALOG_NAMEproject: PROJECT_IDnamespace: NAMESPACE_NAME
ソースを確認する: 完全修飾名のデータセット部分に注意してください。外部ソースによって作成され、BigLake メタストアによって管理される BigLake テーブルは、通常、カタログと名前空間を組み合わせた形式になります。例:
PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table、PROJECT_ID.sap_catalog.sales.delta_table。選択: 選択した BigLake テーブルをアクティブな 会話コンテキストに追加します。
自然言語で質問します。プロンプトは、フェデレーション SQL クエリに自動的に変換されます。
クエリの精度を向上させる
会話分析で BigLake スキーマと用語をより正確に理解できるようにするには、データ エージェントの構成オプションを使用します。これらのオプションには、ビジネス用語集、検証済みの SQL クエリ、システム手順が含まれます。
次のステップ
- BigQuery の会話分析の詳細を確認する。
- BigLake メタストアに外部テーブルを登録する方法を確認する。
- データ エージェントの詳細を確認する。