このガイドでは、BigQuery の 会話分析を使用して、自然言語プロンプトで Google Cloud Lakehouse テーブルのデータをクエリする方法について説明します。
会話分析の仕組み
会話分析では、大規模言語モデル(LLM)を使用して、自然言語の質問を理解し、テーブルのスキーマにマッピングします。プロセスは次のとおりです。
- スキーマ検出: システムは Lakehouse ランタイム カタログからメタデータを取得して、テーブル構造、列名、データ 型を把握します。
- SQL の生成: LLM は、 BigQuery エンジンと基盤となるデータ形式と互換性のある SQL クエリを生成します。
- 実行: BigQuery は、生成された SQL クエリ を Google Cloud Lakehouse のオープン形式データに対して直接実行します。
- レスポンス: 結果は会話インターフェースに返されます。 多くの場合、概要や可視化が伴います。
データ エージェントの管理、料金、ベスト プラクティスなど、会話分析の詳細については、会話分析の概要をご覧ください。
サポートされているファイル形式
会話分析では、自然言語の質問が SQL クエリに変換されます。Lakehouse ランタイム カタログでサポートされているオープン テーブル形式(Apache Iceberg テーブルなど)がサポートされています。
始める前に
データをクエリする前に、Lakehouse ランタイム カタログに外部テーブルを登録します。Lakehouse ランタイム カタログは、BigQuery Studio を外部のオープン形式データに接続する統合ハブとして機能します。接続すると、テーブルは BigQuery 内で検出可能なアセットになります。
会話分析でテーブルをクエリする
コンソールで、 Google Cloud BigQuery Studio エージェント ハブ に移動します。
データ エージェント を作成するか、既存のデータ エージェントとの直接会話を開始します。
テーブルを選択します 。
Lakehouse ランタイム カタログは、これらすべての異なる形式を統合するため、検出エクスペリエンスは標準の BigQuery テーブルの検索と同じです。
検索: ナレッジソースを追加するときに、テーブルの検索と選択のインターフェースでテーブル名を検索します。検索キーワードを使用して、次のような結果をフィルタできます。
TABLE_NAMEcatalog: CATALOG_NAMEproject: PROJECT_IDnamespace: NAMESPACE_NAME
ソースを確認する: 完全修飾名のデータセット部分に注意してください。外部ソースによって作成され、Lakehouse ランタイム カタログによって管理されるテーブルは、通常、カタログと Namespace を組み合わせた形式になります。例:
PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_table、PROJECT_ID.sap_catalog.sales.delta_table。選択: 選択したテーブルをアクティブな会話 コンテキストに追加します。
自然言語で質問します。プロンプトは、フェデレーション SQL クエリに自動的に変換されます。
クエリの精度を向上させる
会話分析でスキーマと用語をより深く理解できるようにするには、データ エージェントの構成オプションを使用します。これらのオプションには、ビジネス用語集、検証済みの SQL クエリ、システム手順が含まれます。
次のステップ
- BigQuery の会話分析について詳細を確認する。
- Lakehouse ランタイム カタログに外部テーブルを登録する方法を確認する。
- データ エージェントの詳細を確認する。