自然言語で Lakehouse テーブルをクエリする

BigQuery の会話型分析では、自然言語のプロンプトを使用して オープン形式のデータにクエリを実行できます。この機能は、 Lakehouse for Apache Iceberg 内の Lakehouse ランタイム カタログ を使用して、質問を基盤となるテーブルスキーマに自動的にマッピングします。これにより、コードを手動で記述せずに SQL クエリを生成して実行できます。

クエリを設定する際に、データ エージェントを使用してビジネス用語集とシステム手順を提供することで、精度を高めることができます。

会話型分析の仕組み

会話型分析では、大規模言語モデル(LLM)を使用して自然言語の質問を理解し、テーブルのスキーマにマッピングします。プロセスは次のとおりです。

  1. スキーマ検出: システムは Lakehouse ランタイム カタログからメタデータを取得して、テーブル構造、 列名、データ型を把握します。
  2. SQL の生成: LLM は、 BigQuery エンジンと基盤となるデータ形式と互換性のある SQL クエリを生成します。
  3. 実行: BigQuery は、生成された SQL クエリを Google Cloud の オープン形式データに対してLakehouse
  4. レスポンス: 結果は会話型インターフェースに返されます。 多くの場合、概要または可視化が伴います。

データ エージェントの管理、料金、ベスト プラクティスなど、会話型分析の詳細については、会話型分析の概要をご覧ください。

サポートされているファイル形式

会話型分析では、自然言語の質問が SQL クエリに変換されます。Lakehouse ランタイム カタログでサポートされているオープン テーブル形式(Apache Iceberg テーブルなど)がサポートされています。

始める前に

データにクエリを実行する前に、Lakehouse ランタイム カタログに外部テーブルを登録します。Lakehouse ランタイム カタログは、BigQuery Studio を外部のオープン形式データに接続する統合ハブとして機能します。接続すると、テーブルは BigQuery 内で検出可能なアセットになります。

会話型分析でテーブルにクエリを実行する

  1. コンソールで、[BigQuery Studio エージェント ハブ] に移動します。 Google Cloud

    エージェント ハブに移動

  2. データ エージェント を作成するか、既存のデータ エージェントとの直接会話を開始します。

  3. テーブルを選択します

    Lakehouse ランタイム カタログは、これらすべての異なる形式を統合するため、検出エクスペリエンスは標準の BigQuery テーブルの検索と同じです。

    1. 検索: ナレッジソースを追加するときに、テーブルの検索と選択のインターフェースでテーブル名を検索します。検索キーワードを使用して、次のような結果をフィルタできます。

      • TABLE_NAME
      • catalog: CATALOG_NAME
      • project: PROJECT_ID
      • namespace: NAMESPACE_NAME
    2. ソースを確認する: 完全修飾名のデータセット部分に注意してください。外部ソースによって作成され、Lakehouse ランタイム カタログによって管理されるテーブルは、通常、カタログと Namespace を組み合わせた形式になります。例: PROJECT_ID.biglake_catalog.finance_namespace.my_iceberg_tablePROJECT_ID.sap_catalog.sales.delta_table

    3. 選択: 選択したテーブルをアクティブな会話 コンテキストに追加します。

  4. 自然言語で質問します。プロンプトは、フェデレーション SQL クエリに自動的に変換されます。

クエリの精度を向上させる

会話型分析でスキーマと用語をより正確に把握できるようにするには、データ エージェントの構成オプションを使用します。これらのオプションには、ビジネス用語集、検証済みの SQL クエリ、システム手順が含まれます。

次のステップ