エンベディングとベクトル検索の概要

このドキュメントでは、BigQuery のエンベディングとベクトル検索の概要について説明します。ベクトル検索は、エンベディングを使用して類似したオブジェクトを比較する手法であり、Google 検索、YouTube、Google Play などの Google プロダクトを強化するために使用されます。ベクトル検索を使用すると、大規模な検索を実行できます。ベクトル検索でベクトルインデックスを使用すると、反転ファイルインデックス（IVF）や ScaNN アルゴリズムなどの基盤となるテクノロジーを活用できます。

ベクトル検索はエンベディングに基づいて構築されています。エンベディングは、テキストや音声ファイルなど、特定のエンティティを表す高次元の数値ベクトルです。機械学習（ML）モデルは、エンベディングを使用してエンティティに関するセマンティクスをエンコードし、エンティティについての推論と比較を容易にします。たとえば、クラスタリングモデル、分類モデル、推奨事項モデルでの一般的なオペレーションは、エンベディング空間内のベクトル間の距離を測定し、意味的に最も類似したアイテムを見つけることです。

エンベディング空間におけるセマンティック類似性と距離という概念は、さまざまなアイテムがどのようにプロットされるかを考えると視覚的にわかります。たとえば、猫、犬、ライオンなどの用語は、すべて動物のタイプを表しますが、意味的な特徴が共通しているため、この空間内で互いに近い位置にグループ化されます。同様に、「車」、「トラック」、「車両」などの一般的なキーワードは別のクラスタを形成します。これを次のイメージに示します。

_猫_、_犬_、_ライオン_、_車_、_トラック_、_車両_ など、意味的に類似したコンセプトは、エンベディング空間内で近くに配置されます。

動物クラスタと車両クラスタが互いに離れて配置されていることがわかります。グループ間の分離は、エンベディング空間内でオブジェクトが近いほど意味的に類似性が高く、距離が大きいほど意味的に類似性が低いという原則を示しています。

ユースケース

エンベディング生成とベクトル検索を組み合わせると、多くの興味深いユースケースが可能になります。いくつかの考えられるユースケースは次のとおりです。

検索拡張生成（RAG）: BigQuery 内で、ドキュメントの解析、コンテンツのベクトル検索の実行、Gemini モデルを使用した自然言語の質問に対する回答の要約生成を行います。このシナリオを示すノートブックについては、BigQuery DataFrames を使用してベクトル検索アプリケーションを構築するをご覧ください。
代替商品や一致する商品を推奨する: 顧客の行動や商品の類似性に基づいて代替商品を提案することで、e コマースアプリケーションを強化します。
ログ分析: チームがログの異常をプロアクティブにトリアージし、調査を迅速化するのに役立ちます。この機能を使用して LLM のコンテキストを拡充し、脅威の検出、フォレンジック、トラブルシューティングのワークフローを改善することもできます。このシナリオを示すノートブックについては、テキストエンベディングと BigQuery ベクトル検索によるログの異常検出と調査をご覧ください。
クラスタリングとターゲティング: オーディエンスを正確にセグメント化します。たとえば、病院チェーンは自然言語のメモと構造化データを使用して患者をクラスタリングできます。また、マーケターはクエリの意図に基づいて広告をターゲティングできます。このシナリオを示すノートブックについては、Create-Campaign-Customer-Segmentation をご覧ください。
エンティティ解決と重複除去: データをクレンジングして統合します。たとえば、広告会社は個人を特定できる情報（PII）レコードの重複除去を行い、不動産会社は一致する郵送先住所を特定できます。

エンベディングを生成する

以降のセクションでは、エンベディングの生成や操作に役立つ BigQuery の関数について説明します。

単一のエンベディングを生成する

AI.EMBED 関数と Vertex AI エンベディングモデルを組みわせて使用すると、入力の単一のエンベディングを生成できます。

AI.EMBED 関数は、次のタイプの入力をサポートしています。

テキストデータ。
ObjectRef 値で表される画像データ（プレビュー）。
ObjectRefRuntime 値で表される画像データ。

エンベディングのテーブルを生成する

AI.GENERATE_EMBEDDING を使用すると、入力テーブルの列にあるすべてのデータのエンベディングを持つテーブルを作成できます。サポートされているすべてのタイプのモデルについて、AI.GENERATE_EMBEDDING は標準テーブルで構造化データを処理します。マルチモーダルエンベディングモデルの場合、AI.GENERATE_EMBEDDING は、標準テーブルの ObjectRef 値を含む列、またはオブジェクトテーブルの視覚的なコンテンツにも対応しています。

リモートモデルの場合、すべての推論は Vertex AI で行われます。他のモデルタイプの場合、すべての推論は BigQuery で行われます。結果は BigQuery に保存されます。

次のトピックを使用して、BigQuery ML でエンベディング生成を試すことができます。

AI.GENERATE_EMBEDDING 関数を使用して、テキスト、画像、動画を生成する
マルチモーダルエンベディングの生成と検索
セマンティック検索と検索拡張生成を行う

自律型エンベディング生成

自律型エンベディング生成を使用すると、エンベディングの作成、メンテナンス、クエリのプロセスを簡素化できます。BigQuery は、ソース列に基づいてテーブルのエンベディングの列を維持管理します。ソース列でデータを追加または変更すると、BigQuery は Vertex AI エンベディングモデルを使用して、そのデータのエンベディング列を自動的に生成または更新します。これは、ソースデータが定期的に更新される状況で BigQuery でエンベディングを維持する場合に役立ちます。

検索

次の検索関数を使用できます。

VECTOR_SEARCH: SQL を使用してベクトル検索を実行します。
AI.SEARCH（プレビュー）: 指定した文字列に近い結果を検索します。この関数は、テーブルで自律型エンベディング生成が有効になっている場合に使用できます。
AI.SIMILARITY（プレビュー）: エンベディング間のコサイン類似度を計算して、2 つの入力を比較します。この関数は、少数の比較を実行する場合や、エンベディングを事前に計算していない場合に適しています。パフォーマンスが重視され、大量のエンベディングを扱う場合は、VECTOR_SEARCH を使用する必要があります。両者の機能を比較して、ユースケースに最適な関数を選択します。

必要に応じて、CREATE VECTOR INDEX ステートメントを使用してベクトルインデックスを作成できます。ベクトルインデックスを使用する場合、VECTOR_SEARCH 関数と AI.SEARCH 関数は近似最近傍検索の手法を使用して、ベクトル検索のパフォーマンスを向上させますが、再現率が低下するため、より近似的な結果が返されます。ベクトルインデックスがない場合、これらの関数はブルートフォース探索を使用して、すべてのレコードの距離を測定します。ベクトルインデックスが利用可能な場合でも、ブルートフォースを使って正確な結果を得ることができます。

料金

VECTOR_SEARCH 関数、AI.SEARCH 関数、CREATE VECTOR INDEX ステートメントでは、BigQuery コンピューティングの料金が使用されます。

VECTOR_SEARCH 関数と AI.SEARCH 関数: オンデマンド料金またはエディション料金を使用して、類似度検索に対して課金されます。
- オンデマンド: ベーステーブル、インデックス、検索クエリでスキャンされたバイト数に対して課金されます。
- エディションの料金: 予約エディション内でジョブを完了するために必要なスロットに対して課金されます。類似性計算の規模が大きく、複雑になるほど、料金が高くなります。
  
  注: Standard エディションでは、インデックスの使用はサポートされていません。
CREATE VECTOR INDEX ステートメント: インデックス付きテーブルデータの合計サイズが組織ごとの上限を下回っている限り、ベクトルインデックスの作成と更新に必要な処理に対する料金は発生しません。この上限を超えるインデックス登録をサポートするには、インデックス管理ジョブ用に独自の予約を指定する必要があります。

エンベディングとインデックスについてもストレージを考慮する必要があります。エンベディングとインデックスとして保存されるバイト数は、アクティブストレージの費用の対象となります。

ベクトルインデックスがアクティブな場合、ストレージの費用が発生します。
インデックスのストレージサイズは、INFORMATION_SCHEMA.VECTOR_INDEXES ビューを使用して確認できます。ベクトルインデックスのカバレッジが 100% でない場合でも、インデックスに登録されたものに対して費用が発生します。インデックスカバレッジは、INFORMATION_SCHEMA.VECTOR_INDEXES ビューを使用して確認できます。

割り当てと上限

詳細については、ベクトルインデックスの上限と生成 AI 関数の上限をご覧ください。

制限事項

VECTOR_SEARCH 関数または AI.SEARCH 関数を含むクエリは、BigQuery BI Engine によって高速化されません。

次のステップ

ベクトルインデックスの作成の詳細を確認する。
VECTOR_SEARCH 関数を使用してベクトル検索を行う方法を学習する。
AI.SEARCH 関数を使用してセマンティック検索を行う方法を学習する。
自律型エンベディング生成の詳細を確認する。
ベクトル検索を使用したエンベディングの検索のチュートリアルでは、ベクトルインデックスを作成し、インデックスありとインデックスなしの両方でエンベディングのベクトル検索を行う方法を学習できます。
セマンティック検索と検索拡張生成を行うのチュートリアルでは、次のタスクを行う方法を学習できます。
- テキストエンベディングを生成する。
- エンベディングにベクトルインデックスを作成する。
- エンベディングでベクトル検索を行い、類似したテキストを検索する。
- ベクトル検索の結果からプロンプト入力を補強して結果を改善することで、検索拡張生成（RAG）を行う。
検索拡張生成パイプラインで PDF を解析するチュートリアルでは、解析された PDF コンテンツに基づいて RAG パイプラインを作成する方法を確認できます。
Python で BigQuery DataFrames を使用してベクトル検索を実行することもできます。このアプローチを示すノートブックについては、BigQuery DataFrames を使用してベクトル検索アプリケーションを構築するをご覧ください。