取得とランキングについて

このページでは、Vertex AI Search アプリで関連性の高い 検索結果を提供するために、検索とランキングがどのように連携しているかについて説明します。

概要

簡単に言うと、検索は関連するドキュメントを見つけることであり、ランキングは 取得したドキュメントを並べ替えることです。利用可能なすべてのドキュメント をランク付けするには、計算コストが高くなる可能性があります。そのため、検索とランキングは順番に 行われます。

まず、検索モデルがクエリを理解して書き換えます。 次に、利用可能なデータソースとデータストア内のインデックス付き ドキュメントの数に応じて、モデル は数千件のドキュメントを取得します。取得したドキュメントには関連性スコアが割り当てられます。

ランキング モデルは、取得したドキュメントを並べ替え 上位 400 件のランク付けされた結果を提供します。次の図は、 これらの 2 つのプロセスが検索ワークフローにどのように適合するかを示しています。

検索における取得とランキング
図 1.検索ワークフローでの検索とランキング

検索方法

検索とは、ユーザーのクエリに関連するドキュメントのサブセットをデータストアから選択するプロセスです。 Vertex AI Search モデル は、次のような さまざまなシグナルに基づいて検索アプリの検索を管理し、関連性スコアを割り当てます。

  • トピック性: キーワード マッチング、ナレッジグラフ、ウェブ シグナルが含まれます。

  • エンベディング: 概念的に類似したコンテンツを見つけるためのエンベディングが含まれます。

  • クロスアテンション: モデルが クエリとドキュメントの関係を考慮して、ドキュメントに関連性スコアを割り当てることができます。

  • 鮮度: データ ストア内のドキュメントの経過時間を特定します。

  • ユーザー イベント: パーソナライズに使用されるコンバージョン シグナルが含まれます。

また、検索リクエストでは、 関連性フィルタウェブサイト データ構造化データまたは非構造化データのメタデータ フィルタを指定して、 関連するドキュメントのリストを絞り込むことができます。

ランキング方法

ランキングは、検索フェーズで選択されたドキュメントを取得し、 次の条件に従って新しい関連性スコアを割り当てて、 並べ替えます。

  • ブースト: カスタム属性または 鮮度に応じて、特定の結果を昇格または降格します。これは、取得した最初の 1,000 件のドキュメントに影響し、上位 400 件をランク付けします。 詳細については、検索結果をブーストするをご覧ください。
  • カスタム ランキング: 特定の要件に合わせて、数式ベースのランキング アルゴリズムを使用して、デフォルトのランキング ロジックを制御、調整、オーバーライドします。結果の提供時に、カスタム ランキングによって割り当てられた関連性スコアが優先されます。詳細については、 検索結果のランキングをカスタマイズするをご覧ください。
  • 並べ替え: 並べ替え手順(日付など)を適用します。
  • 検索チューニング: モデルが ドキュメントのセマンティックな関連性を認識する方法に影響し、エンベディングの関連性スコアを変更します。詳細については、 検索チューニングで 検索結果を改善するをご覧ください。
  • イベントベースの再ランキング: ユーザー イベントに基づくパーソナライズ モデルを使用して、提供時に結果を更新します。