このページでは、カスタムアプリの Agent Search の機能を紹介し、一覧を示します。また、カスタムアプリの Agent Search の使用を開始するための、利用可能な機能、チュートリアル、チェックリストへのリンクも記載されています。
カスタムアプリの Agent Search とは
カスタムアプリの Agent Search は、ウェブサイト データやその他の構造化データまたは非構造化データを含むアプリケーションに統合できる、Google 品質の強力な検索エンジンとコンテンツ検出エンジンです。検索機能は基本的なキーワード マッチングを超えており、AI を使用して関連性の高い結果を提供し、パーソナライズされたブラウジングと検索のエクスペリエンスを提供し、データに基づいて AI 回答を生成します。
カスタム検索アプリは、一般公開ウェブサイトにある、または構造化形式または非構造化形式の、業種に依存しないデータに使用できます。 また、Agent Search には、業種固有の検索アプリとレコメンデーション アプリもあります。
- メディアデータについては、 メディア検索とレコメンデーションの概要をご覧ください。
- コマースと小売のデータについては、 AI Commerce Searchをご覧ください。
- 医療データについては、 医療検索チェックリストをご覧ください。
主な機能
Agent Search の主な機能は次のとおりです。
- 高品質な検索: Google の検索に関する専門知識を活用して、複雑なクエリや自然言語クエリでもユーザーの意図を理解します。キーワード検索とセマンティック検索を組み合わせて、最適な結果を提供します。
- パーソナライズされたブラウジング: 特定の検索クエリなしでパーソナライズされた結果を提供し、ユーザーのコンテキストとナビゲーション パターンに基づいてパーソナライズされたフィードを提供します。パーソナライズされたカテゴリ ページやホームフィードを表示する検出エクスペリエンスに最適です。
- データソース: 次のようなさまざまなデータソースに対応しています。
- ウェブサイト: 一般公開ウェブサイトをインデックスに登録し、ウェブサイトの構造化データを使用したインデックスの拡充などの高度な機能を使用します。
- 構造化データ: データベース、Cloud Storage の JSON ファイル、BigQuery テーブルなど、定義された形式で整理されたデータを検索します。たとえば、ホテルのカタログ、不動産のリスティング、レストランのディレクトリなどです。
- 非構造化データ: Cloud Storage または BigQuery に保存されている PDF、HTML ファイル、TXT ファイルなどのドキュメントや、JPEG ファイルや PNG ファイルなどの画像ファイルを検索します。
- 統合検索: 上記のデータソースのデータを統合 する複数のデータストアを検索します。たとえば、検索アプリを作成して、ウェブサイト データストアとドキュメント データストアに接続できます。これにより、ユーザーはすべてのコンテンツを一度に検索できます。
- グラウンディングされた AI 回答の生成: ソースドキュメントへの引用を含む、データに基づいて AI 回答を生成します。もっと聞くことや関連クエリを行うこともできます。
- パーソナライズ: クリックやコンバージョンなどのユーザー イベントで取得したユーザー インタラクションから学習することで、結果とランキングを時間とともに改善します。
- カスタマイズ: ビジネスニーズに合わせて検索とブラウジングのエクスペリエンスを調整して構成する方法がいくつか用意されています。
概要
次の図は、カスタム検索の主要コンポーネントとそれらの連携を示しています。
カスタム検索の Agent Search のコンポーネントは次のように説明できます。
- データストア: さまざまなデータソースのコンテンツは、 Agent Search データストアに保存されます。ソースデータは、一般公開ウェブサイトのデータ、構造化データ、非構造化データです。
- データ処理とインデックス登録: Agent Search はデータを理解して
インデックスに登録し、検索可能で取得可能な表現を作成します。これには次のものが含まれます。
- キーワード抽出: 正しい情報を取得するために必要な重要な用語を特定して生成します。
- エンベディングを使用したセマンティック理解: コンテンツの意味を捉えるベクトル エンベディングを作成します。
- メタデータ処理: ドキュメントの構造化データまたはメタデータを使用してドキュメントを処理します。たとえば、ホテルのカタログの場所、ウェブページのメタデータの変更日または作成日などです。
- 高度なドキュメント解析: ドキュメント構造を理解し、OCR またはレイアウト解析を使用して、表、画像、グラフなどの高度な情報にアノテーションを付けます。
- 検索アプリ: カスタム検索の中核となるのは検索アプリです。このアプリは、さまざまなソースからデータを取り込む 1 つ以上のデータストアに接続します。統合検索の場合、データはコネクタ を介して取り込まれます。検索とブラウジングの動作はアプリレベルで構成します。
- ユーザー クエリ: アプリから情報を取得するためのユーザーからの入力。次の 2 種類があります:
- 検索クエリ: ユーザーはテキストまたは画像を使用して、ターゲットとする検索クエリを入力します。 テキスト検索は予測入力によって強化されています。
- ナビゲーション クエリまたはブラウジング: 特定のクエリなしで、パーソナライズされた関連性の高いコンテンツを提供する探索的検索。ユーザーの過去のアクティビティや、現在のカテゴリ ページや場所などの他のシグナルによって強化されています。
- 検索とランキング: 検索結果の検索とランキングには、いくつかのサブコンポーネントがあります。
- 検索のクエリ理解: Agent Search は、次のものを使用して検索クエリを分析します。
- 自然言語処理: 意図を理解します。
- 自然言語理解を使用したフィルタ: 自然言語クエリの位置情報を地理座標に変換し、自然言語クエリの条件をフィルタに変換します。
- ナレッジグラフ: 用語の曖昧さを解消し、検索を拡張します。
- オプション機能: スペル修正、類義語、クエリの言い換えが含まれます。
- 検索: Agent Search は、次の方法に基づいて最も関連性の高いドキュメントまたはチャンクを見つけます。
- 検索のキーワード マッチタイプ: 用語に基づく従来の検索。
- セマンティック検索: エンベディングを使用して、概念的に類似したコンテンツを見つけます。
- フィルタ: 構成したフィルタ(日付、カテゴリ、関連性スコアなど)を適用します。
- ランキング: Agent Search は、次の要素に基づいて結果をランク付けします。
- 関連性: 検索時のキーワード マッチングとセマンティック マッチングの組み合わせ。
- ウェブサイト検索のウェブシグナル: ページの品質や人気などの要素。
- ブーストと埋め込み: 特定の結果を昇格または降格するためのカスタムルール。
- パーソナライズ: ユーザー インタラクションから学習します。これは省略可能ですが、強くおすすめします。
- 順序付け: 順序付けの手順(日付順など)を適用します。
- 検索のクエリ理解: Agent Search は、次のものを使用して検索クエリを分析します。
- 結果と回答の生成:
- 検索結果: 関連するドキュメントまたはチャンクのランク付けされたリストが、スニペット、抽出された回答、抽出されたセグメントなどのオプション機能とともに返されます。提供される結果は、サービス提供コントロールを使用して構成できます。検索結果を調整することもできます。
- 回答の生成: 上位の結果と関連する結果に基づいて、引用を含む簡潔な合成回答が生成されます。これには高度な LLM 機能が使用されます。
- パーソナライズされたブラウジング: エンゲージメントまたはコンバージョンが発生する可能性が最も高い、パーソナライズされたドキュメントのセットが返されます。この予測では、ユーザー インタラクションから学習する高度なモデルが使用されます。
- ユーザー イベント: クリックや閲覧などのユーザー インタラクションのトラッカー。Agent Search が学習し、検索とパーソナライズを改善するのに役立ちます。ユーザー イベントは、エンゲージメント、コンバージョン、収益などのビジネス KPI の最適化に役立ちます。
主な機能と構成
カスタム検索アプリでは、次の機能と構成を使用できます。各段階でこれらの設定をカスタマイズして、ユーザーに最適な結果を提供できます。
詳細については、次の構成をご覧ください。
- データの準備:
- 構造化データのスキーマ: フィールド 名と型を使用してデータの構造を定義します。独自のスキーマを指定することも、Agent Search に自動検出させることもできます。詳細については、 スキーマを指定または自動検出するをご覧ください。
- メタデータ: 構造化ドキュメントまたは非構造化ドキュメント、 ウェブページにメタデータを追加して、検索を改善し、フィルタを有効にします。詳細については、以下をご覧ください。
- チャンキング: 関連性と LLM 処理を向上させるために、ドキュメントを小さな部分に分割します。詳細については、ドキュメントを解析してチャンクに分割するをご覧ください。
- 解析: 次のいずれかのオプションを使用して、テキスト、画像、その他のアノテーションを抽出します:
- 機械で読み取り可能なテキストを抽出するデジタル パーサー。
- スキャンした PDF または画像からテキストを抽出する PDF 用の OCR パーサー。
- レイアウト パーサー。ドキュメント構造を検出し、画像や グラフにアノテーションを付けて、チャンク処理とドキュメント理解を向上させます。これは、複雑なドキュメントや RAG アプリケーションに必要です。
- カスタム エンベディング: 独自に準備したベクトル エンベディングをアップロードします。 詳細については、 カスタム エンベディングを使用するをご覧ください。
- データの取り込み: Agent Search
では、さまざまなソースのデータに対して、次のようなさまざまな取り込みタイプが用意されています。
- ウェブサイト データのクロール
- Cloud Storage と BigQuery から、または REST API を介して 構造化 データと 非構造化 データを取り込む
- 検索とブラウジングの構成:
- フィールド設定: 検索と回答 の生成用にフィールドを構成する方法(検索可能、取得可能、インデックス登録可能など)を制御します。詳細については、フィールド設定を構成するをご覧ください。
- 予測入力: ユーザーの入力に応じてクエリの候補を表示します。詳細については、予測入力を構成するをご覧ください。
- サービス提供コントロール: 検索行動を変更するルールを作成します。詳細については、
検索のサービス提供コントロールを構成する
をご覧ください。
- ブースト/埋め込み: フィルタに基づいて特定の結果を昇格または降格します。
- フィルタ: フィルタに基づいて結果を削除します。
- 類義語: 特定の用語を同義語として扱います。
- リダイレクト: 特定のクエリに対してユーザーを特定の URL に送信します。
- 昇格コントロール: Agent Search データストアの内外で結果を昇格します。
- 検索のチューニング(プレビュー): クエリとテキスト 抽出のペアに基づいてモデルをさらにトレーニングします。詳細については、 検索のチューニングで検索結果を改善するをご覧ください。
- ウェブサイト固有の構成:
- 高度なインデックス登録: 詳細については、 ウェブサイトの高度なインデックス登録を有効にするをご覧ください。
- ウェブページを更新する: ウェブサイトのドキュメントを 定期的に 自動更新または手動更新を使用して更新できます。また、 サイトマップに基づく更新を選択することもできます。
- 検索: 次の検索方法を構成します。
- ランキング: 取得した結果をブーストまたは埋め込み、ウェブ検索結果を並べ替え、または構造化データストアの結果を並べ替えます。
- 検索結果: Agent Search を使用して次の操作を行います:
- 回答とフォローアップを取得する。
- 検索の要約を取得する。
- スニペットと抽出コンテンツを取得する。
- ユーザー イベントを必要とするパーソナライズされたブラウジング エクスペリエンスを生成する
- ユーザー イベント: クリックや閲覧などのユーザー インタラクションを記録して、 検索とパーソナライズを改善します。詳細については、 カスタムアプリのユーザー イベントについてをご覧ください。