BigQuery の AI の概要

BigQuery には、次のことを可能にするさまざまな AI 機能が用意されています。

  • 予測機械学習(ML)を行う。
  • Gemini などの大規模言語モデル(LLM)に対して推論を実行します。
  • エンベディングとベクトル検索を使用してアプリケーションを構築します。
  • 組み込みのエージェントを使用してコーディングを支援します。
  • データ パイプラインを作成する。
  • エージェント ツールを使用して BigQuery の機能にアクセスします。

機械学習

BigQuery ML を使用すると、時系列予測、異常検出、分類、回帰、クラスタリング、次元削減、推奨事項などのタスクのモデルをトレーニング、評価、推論できます。

BigQuery ML の機能は、Google Cloud コンソール、bq コマンドライン ツール、REST API、または Colab Enterprise ノートブックで操作できます。BigQuery ML を使用すると、SQL 実務担当者は既存の SQL ツールとスキルを使用してモデルを構築して評価できるため、ML をより多くの人が利用できるようになり、データの移動を必要とせずに ML をデータに適用することでモデル開発を高速化できます。BigQuery ML を使用して、次のタイプの ML タスクを実行できます。

  • GoogleSQL クエリを使用して ML モデルを作成して実行します。
  • Colab Enterprise ノートブックを作成して、ML ワークフローを実行します。ノートブックを使用すると、SQL と Python を相互に切り替えて使用し、開発に AI または ML の Python ライブラリを使用できます。
  • Explainable AI を使用して、予測 ML モデルの結果を理解します。
  • TimesFMARIMA_PLUSARIMA_PLUS_XREG モデルを使用して、時系列データに対して予測異常検出を行います。
  • 貢献度分析を使用して、多次元データの主な指標の変化に関する分析情報を生成します。

詳細については、BigQuery の ML の概要をご覧ください。

AI 関数

BigQuery には、テキスト生成、テキストまたは非構造化データの分析、翻訳などの AI タスクに使用できるさまざまな SQL 関数が用意されています。これらの関数は、Vertex AI、Cloud AI API、または組み込みの BigQuery モデルから利用可能な Gemini モデルとパートナー LLM モデルにアクセスして、これらのタスクを実行します。

AI 関数にはいくつかのカテゴリがあります。

  • 生成 AI 関数。これらの関数は、コンテンツの生成、分析、要約、構造化データの抽出、分類、エンベディングの生成、データ拡充などのタスクを実行するのに役立ちます。生成 AI 関数には次の 2 つのタイプがあります。

    • 汎用 AI 関数を使用すると、使用するモデル、プロンプト、パラメータを完全に制御し、透明性を確保できます。
    • マネージド AI 関数は、フィルタリング、評価、分類などのルーティン タスクの構文を簡素化します。BigQuery は、費用と品質が最適化されたモデルを自動的に選択します。
  • タスク固有の関数。これらの関数は、次のようなタスクで Cloud AI API を使用するのに役立ちます。

詳細については、タスク固有のソリューションの概要をご覧ください。

BigQuery には、特定のデータを効率的に見つけたり、マルチモーダル データを含むデータ間の類似性を検出したりするのに役立つ、さまざまな検索関数と機能が用意されています。

  • テキスト検索。SEARCH 関数を使用すると、非構造化テキストまたは半構造化 JSON データに対してトークン化された検索を実行できます。検索インデックスを作成すると、検索のパフォーマンスを向上させることができます。これにより、BigQuery は SEARCH 関数を使用するクエリや、その他の関数と演算子を最適化できます。詳細については、インデックス登録されたデータを検索するをご覧ください。

  • エンベディングの生成。エンベディングは、テキストや画像などのエンティティを表す高次元の数値ベクトルであり、多くの場合、ML モデルによって生成されます。Vertex AI で提供またはホストされているモデルを使用するか、BigQuery にインポートして実行するモデルを使用して、マルチモーダル エンベディングを生成できます。

    自律型エンベディング生成プレビュー)を有効にすると、BigQuery でエンベディングの列を自動的に維持することもできます。

  • ベクトル検索。VECTOR_SEARCH 関数を使用してエンベディングを検索し、意味的に類似したアイテムを見つけることができます。AI.SEARCH 関数プレビュー)を使用すると、自律型エンベディング生成が有効になっているテーブルを検索できます。ベクトル インデックスを作成すると、ベクトル検索のパフォーマンスを向上させることができます。ベクトル インデックスでは、近似最近傍検索の手法を使用して、より高速で近似的な結果を提供します。

    ベクトル検索の一般的なユースケースには、セマンティック検索、レコメンデーション、検索拡張生成(RAG)などがあります。詳細については、ベクトル検索の概要をご覧ください。

支援型 AI 機能

BigQuery の AI を活用したアシスタント機能(総称して Gemini in BigQuery と呼ばれます)は、データの検出、準備、クエリ、可視化に役立ちます。

  • データ分析情報。データに関する自然言語の質問と、それらの質問に回答する SQL クエリを生成します。
  • データの準備。コンテキストに応じた推奨事項を生成して、データのクリーニング、変換、拡充を行います。
  • SQL コードアシスト。SQL クエリの生成、補完、説明を行います。
  • Python コードアシスト。PySpark や BigQuery DataFrames などの Python コードの生成、補完、説明を行います。
  • データ キャンバス。自然言語を使用してデータにクエリを実行し、グラフで結果を可視化して、フォローアップの質問をします。
  • SQL 変換ツール。Gemini 拡張 SQL 変換ルールを作成して、別の言語で記述されたクエリを GoogleSQL に移行します。

エージェント

エージェントは、AI を使用してユーザーに代わってタスクを完了できるソフトウェア ツールです。組み込みエージェントを使用することも、独自のエージェントを作成することもできます。これらのエージェントは、データの処理、管理、分析、可視化に役立ちます。

  • データ サイエンス エージェントを使用して、Colab Enterprise ノートブック内で探索的データ分析、データ処理、ML タスク、可視化分析情報の自動化を行います。

  • Data Engineering Agent を使用して、BigQuery でデータを読み込んで処理するデータ パイプラインを構築、変更、管理します。自然言語プロンプトを使用して、さまざまなデータソースからデータ パイプラインを生成したり、データ エンジニアリングのニーズに合わせて既存のデータ パイプラインを調整できます。

  • Gemini CLI を使用して、自然言語プロンプトを使用してターミナルで BigQuery データとやり取りします。

  • MCP ツールボックスを使用して、独自の AI ツールを BigQuery に接続し、データを操作します。

次のステップ