このインタラクティブなデモでは、Vector Search 2.0( のフルマネージド ベクトル データベース Google Cloud)を試すことができます。 このデモでは、セマンティック検索 (Gemini 自動エンベディング キーワード テキスト検索または Reciprocal Rank Fusion(RRF) を使用してセマンティック検索とキーワード テキスト検索の両方を組み合わせたハイブリッド検索)を使用して、数百万件の商品リストを検索できます。結果は、 再ランク付けできます。これには、Gemini Enterprise Agent Platform Ranking API が使用されます。
Vector Search 2.0 のメリット
Vector Search では、エンベディングの生成、インデックスのデプロイ、メタデータ用の Vertex AI Feature Store が別途必要でした。Vector Search 2.0 では、データとエンベディングの統合ストレージ、自動エンベディング生成、組み込みのテキスト検索が提供され、インフラストラクチャを管理する必要はありません。
試してみましょう
実行方法:
[クエリ] フィールドに、クエリするアイテムの説明(
vintage 1970s pinball machineなど)を入力します。または、[クエリを生成] をクリックして、説明を自動生成します。[Submit] をクリックするか、[Enter] キーを押します。
デモでさまざまなオプションを試すことで、Vector Search 2.0 とベクトル検索テクノロジーの基本をいち早く理解できます。 詳細については、ユーザー インターフェースをご覧ください。
ユーザー インターフェース
このセクションでは、Vector Search 2.0 が返す結果と、そのランク付け方法を制御するために使用できる UI の設定について説明します。
データセット
[データセット] プルダウンを使用して、Vector Search 2.0 がクエリを実行するデータセットを選択します。各データセットの詳細については、データセットをご覧ください。
クエリ
クエリを実行するには:
[データセット] をクリックし、クエリを実行するデータセットを選択します。
[クエリ] フィールドに、説明を追加するか、質問をするか、1 つ以上のキーワードを入力して、Vector Search 2.0 が結果を返すアイテムを指定します。 または、[クエリを生成] をクリックして、クエリを自動生成します。
次のいずれかを行います。
- 意味的に類似した結果を返すには、[セマンティック] を選択します。
- クエリのテキスト構文に基づいて結果を返すには、[テキスト] を選択します。
- ハイブリッド検索を行うには、[セマンティック] と [テキスト] の両方を選択します。
[Mercari 3M items (128-dim Gemini text embeddings)] または [Mercari 3M items (768-dim Gemini text embeddings)] データセットのいずれかをセマンティックにクエリする場合は、[クエリタスクタイプ] をクリックして、[QUESTION_ANSWERING] または [RETRIEVAL_QUERY] を選択します。
[送信] をクリックするか、[Enter] キーを押してクエリを実行します。
変更
Vector Search 2.0 がクエリから返す結果を変更するために使用できるオプションは多数あります。
[行] をクリックし、Vector Search 2.0 で返す検索結果の最大数を選択します。
[セマンティック] を選択すると、意味的に類似した結果が返されます。
[テキスト] を選択すると、クエリのテキスト構文に基づいて結果が返されます。
[セマンティック] と [テキスト] の両方を選択すると、ハイブリッド検索が有効になります。
[再ランク付け] を選択すると、検索結果がクエリの関連性に基づいて再ランク付けされます。 詳細については、Ranking API で検索と RAG の品質を改善するをご覧ください。
[kNN を使用] を選択すると、k 近傍アルゴリズム を使用して検索結果を取得します。kNN は 100% の再現率を提供するため、デバッグやテストに非常に役立ちます。
[クエリタスクタイプ] をクリックし、使用するクエリタスクタイプを選択します。これは、[Mercari 3M items (128-dim Gemini text embeddings)] データセットと [Mercari 3M items (768-dim Gemini text embeddings)] データセットを使用する場合にのみ使用できます。 クエリタスクタイプの詳細については、 エンベディングのタスクタイプを選択するをご覧ください。
[RRF Alpha] フィールドに 0.0 ~ 1.0 の値を入力して、RRF ランキング効果を指定します。これは、ハイブリッド検索([セマンティック] と [テキスト] の両方が選択されている)でのみ使用できます。
アルファ値:1.0- セマンティック(高密度)類似性のみに基づいて結果をランク付けします。0.0- キーワード(スパース)の関連性のみに基づいて結果をランク付けします。0.5- セマンティック(高密度)類似性とキーワード(スパース)の関連性に同じ重みを付けて結果をランク付けします。
詳細については、Reciprocal Rank Fusion とはをご覧ください。
指標
クエリの実行後、検索のさまざまな段階の完了にかかった時間を分類したレイテンシ指標が提供されます。
以下に例を示します。
- すべてのソースからの合計レイテンシ。
- エンベディングを生成してベクトル検索を実行するのにかかった時間。
- [再ランク付け] が選択されている場合の再ランク付けにかかった時間。
- ネットワークやその他のソースからの合計レイテンシ。
エンベディング
Vector Search 2.0 では、次のエンベディング タイプがサポートされています。
マルチモーダル: 商品画像のマルチモーダル セマンティック検索。詳しくは、マルチモーダル検索とは何か: 「視覚を持った LLM」でビジネスが変わるをご覧ください。
テキスト(意味的類似性): 意味的類似性に基づいて、アイテム名と説明のテキスト セマンティック検索を行います。詳細については、 Vertex AI Embeddings for Text で実現する LLM のグラウンディングをご覧ください。
テキスト(ドキュメントの取得): 質問または短いフレーズに基づく非対称検索。詳細については、Vertex AI Embeddings for Text で実現する LLM のグラウンディングをご覧ください。
単語: 推論が非常に高速で、非常にコンパクトな単語レベルのセマンティック理解。
クエリプロセス
Vector Search 2.0 では、クエリプロセスは実行される検索の種類とエンベディング モデルによって異なります。
セマンティック検索とハイブリッド検索
エンベディングの生成と検索は、1 回の API 呼び出しで行われます。
Vector Search 2.0 では、
Collection の vertex_embedding_config で指定された
モデルを使用して、クエリ エンベディングをサーバーサイドで自動生成し、検索を実行して、個別の Vertex AI Feature Store フェッチを必要とせずに完全なメタデータを含む結果を返します。
Word2Vec とマルチモーダル
クライアントはクエリ エンベディングを生成し、ベクトル検索のために Vector Search 2.0 に送信します。結果には、Collection の完全なメタデータが含まれており、Vertex AI Feature Store フェッチは必要ありません。
テキスト
Vector Search 2.0 は、組み込みのキーワード マッチングを直接実行します。エンベディングは生成されません。
データセット
| データセット | 説明 | エンベディング モデル | エンベディング タスクタイプ |
|---|---|---|---|
| メルカリ 100 万件の商品 (768 次元の Gemini テキスト エンベディング) |
テキスト エンベディングと画像エンベディングが分離された Gemini Embedding 2 エンベディング モデルを使用します。このデータセットは、さまざまなベクトル フィールドを使用して、テキストからテキストへの検索とテキスト画像変換検索をサポートしています。 | gemini-embedding-2-preview
|
SEMANTIC_SIMILARITY |
| メルカリ 300 万件の商品 (128 次元の Gemini テキスト エンベディング) |
エンベディング ディメンションの数が減り、インデックス サイズとストレージ費用が削減されます。このデータセットの精度は、メルカリ 300 万件の商品(768 次元の Gemini テキスト エンベディング)よりも低い可能性があります。 | gemini-embedding-001
|
RETRIEVAL_DOCUMENT |
| メルカリ 300 万件の商品 (768 次元の Gemini テキスト エンベディング) |
自動エンベディングと高いテキスト セマンティック精度を備えたフルディメンション エンベディングがあります。このデータセットでは、非対称のクエリとドキュメントのマッチングに RETRIEVAL_DOCUMENT を使用します。 | gemini-embedding-001
|
RETRIEVAL_DOCUMENT |
| メルカリ 300 万件の商品 (768 次元の Gemini テキスト エンベディング、意味的類似性) |
類似性マッチングに SEMANTIC_SIMILARITY タスクタイプを使用します。このデータセットは、クエリとドキュメントの意味が同じである「類似アイテムを検索」機能が必要なユースケースに最適です。 | gemini-embedding-001
|
SEMANTIC_SIMILARITY |
| メルカリ 300 万件の商品 (1408 次元の Vertex AI マルチモーダル エンベディング) |
画像検索用にアイテム画像をエンコードする Vertex AI マルチモーダル エンベディングがあります。 | multimodal-embedding-001
|
なし |
| メルカリ 300 万件の商品 (100 次元の Word2Vec テキスト エンベディング) |
Gensim Word2Vec エンベディング モデルを使用します。このデータセットは推論が最も高速です。単語レベルのセマンティック理解のみを提供しますが、非常にコンパクトです。 | Gensim Word2Vec | なし |