注: Vertex AI Search は Agent Search に名称変更されます。現在、新しいブランディングを反映するようにコンテンツの更新を進めています。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

アプリとデータストアについて

このページでは、Agent Search アプリとデータストアについて説明します。

Agent Search では、検索アプリまたはレコメンデーションアプリを作成し、それをデータストアに接続します。 1 つの Google Cloud プロジェクトに複数のアプリを含めることができます。

アプリとデータストアの関係

アプリとデータストアの関係は、アプリのタイプによって異なります。

カスタム検索アプリは、データストアと多対多の関係にあります。複数のデータストアが 1 つのカスタム検索アプリに接続されている場合、これを統合検索と呼びます。 1 つの検索アプリを複数のデータストアに接続する際の制限事項については、統合検索についてをご覧ください。
カスタムレコメンデーションアプリは、データストアと 1 対 1 の接続にあります。
メディアアプリは、データストアと多対 1 の関係にあります。アプリは 1 つのデータストアにしか接続できませんが、1 つのデータストアを複数のアプリに接続することが可能です。たとえば、メディア検索アプリとメディアレコメンデーションアプリで 1 つのデータストアを共有できます。
ヘルスケア検索アプリは、データストアと多対 1 の関係にあります。アプリは 1 つのデータストアにしか接続できませんが、1 つのデータストアを複数のアプリに接続することが可能です。たとえば、患者向けアプリと医療機関向けアプリから同じデータストアに接続できます。

ヘルスケアデータのバッチデータインポートの場合、データはアプリ内のデータストアにインポートされます。ヘルスケアデータのストリーミングデータインポート（プレビュー）の場合、データはエンティティにインポートされます。これは、データコネクタ内のデータストアの一種です。データコネクタは、アプリ内のデータストアの一種でもあります。

**非推奨:** ヘルスケア向けの Agent Search は非推奨となり、2027 年 5 月 15 日以降はご利用いただけなくなります。

データストアをアプリに接続した後に切断することはできません。

アプリ作成とデータの取り込みの方法

アプリを作成してデータを取り込む方法は、データの種類によって次のように異なります。

ウェブサイトのデータについては、 Google Cloud コンソールと API のどちらも使用できます。 API で作成したウェブサイトのデータを使用するには、コンソールで Enterprise 機能が有効になっているアプリに接続する必要があります。 Google Cloud
構造化データまたは非構造化データについては、 Google Cloud コンソールと API のどちらも使用できます。
ヘルスケアデータについては、 Google Cloud コンソールと API のどちらも使用できます。

ドキュメント

各データストアには、「ドキュメント」と呼ばれるデータレコードが 1 つ以上あります。ドキュメントが何を表すかは、データストア内のデータの種類によって次のように異なります。

Websiteドキュメントはウェブページです。
構造化データドキュメントは、特定のスキーマに従うテーブルの 1 行または 1 つの JSON レコードです。このスキーマを独自に指定することも、取り込んだデータから Agent Search で自動的にスキーマを取得することもできます。
メディアの構造化データ 。ドキュメントは、メディアに固有のスキーマに従うテーブルの 1 行または JSON レコードです。ドキュメントは、動画、ニュース記事、音楽ファイル、ポッドキャストなどのメディアコンテンツに関するレコードです。ドキュメントには、メディアアイテムを説明する情報（タイトル、コンテンツの場所の URI、カテゴリ、再生時間、利用可能日など）が少なくとも含まれています。
非構造化データ 。ドキュメントは、TXT、PDF、HTML、DOCX、PPTX、XLSX、XLSM のいずれかの形式のファイルです。
医療 FHIR データ 。ドキュメントは、サポートされている FHIR R4 リソースです。Agent Search でサポートされている FHIR R4 リソースのリストについては、 Healthcare FHIR R4 データスキーマリファレンスをご覧ください。

データストアとアプリ

Agent Search には、さまざまな種類のデータストアがあります。各データストアには 1 種類のデータのみを含めることができます。

ウェブサイトのデータ
構造化データ
構造化コンテンツ（メディア）
非構造化データ
医療 FHIR データ

ウェブサイトのデータ

ウェブサイトのデータを含むデータストアは、公開ウェブサイトからインデックス登録されたデータを使用します。データストアに含める URL パターンのセットを指定できます。URL パターンに一致するウェブページは、含まれるウェブページと呼ばれます。含まれるウェブページからクロールされたデータに対する検索を設定できます。

たとえば、example.com/faq/* や example.com/events/* などの URL パターンを指定して、パターンに一致するウェブページからクロールされたデータに対する検索を有効にできます。このデータには、テキスト、メタデータでタグ付けされた画像、その他の構造化データ（meta タグ、PageMap 属性、schema.org データなど）が含まれます。

除外するウェブサイトの部分の URL パターン（example.com/events/members-only/* や example.com/events/past-* など）を指定することもできます。除外された URL は、含まれる URL よりも優先されます。

ウェブサイトのデータストアには次の 2 種類があります。

基本的なウェブサイト検索:
- 含まれるウェブサイトの既存の Google 検索インデックスに対する検索機能を提供します。
- ドメインの所有権を証明する必要はありません。
ウェブサイトの高度なインデックス登録:
- 次のいずれかに基づいて生成されたインデックスに対する高度な検索機能を提供します。
  - Agent Search アプリのオーナーは、サイトマップを送信して管理することで、インデックス登録するウェブページを制御できます。詳細については、サイトマップを使用してウェブページをインデックス登録して更新するをご覧ください。このプロセスにより、手動で操作しなくてもインデックスを最新の状態に保つことができます。
  - Agent Search アプリのオーナーは、Google 検索インデックスをミラーリングする初期インデックス登録を行い、必要に応じてウェブサイトを再クロールしてインデックスの範囲を拡大し、最新の状態に保つことができます。詳細については、ウェブページを更新するをご覧ください。ウェブサイトの高度なインデックス登録の高度な機能については、ウェブサイトの高度なインデックス登録をご覧ください。
- Agent Search データストアのオーナーは、含まれるウェブサイトが属するドメインを確認する必要があります。詳しくは、ウェブサイトのドメインを確認するをご覧ください。
- データストアスキーマに構造化データを追加する機能を提供します。ウェブサイトには非構造化データが含まれていますが、meta タグ、PageMap 属性、schema.org データの形式で構造化データをウェブページに追加できます。この構造化データを使用して、ウェブサイトの高度なインデックス登録に構造化データを使用するで説明されているように、データストアスキーマを編集できます。

次のステップ

ウェブサイト検索の場合:

インデックス登録の前提条件については、ウェブサイト検索用にデータを準備する方法をご覧ください。
ウェブサイトのコンテンツを使用してデータストアを作成します。
検索アプリを作成します。

構造化データ

構造化データを含むデータストアでは、構造化データに対するセマンティック検索やレコメンデーションを利用できます。BigQuery または Cloud Storage からデータをインポートできます。また API を使用して構造化 JSON データを手動でアップロードすることもできます。

たとえば、e コマースエクスペリエンスの場合は、商品カタログに基づいた検索やレコメンデーションを有効にできます。また、サービス提供者の場合は、医師名簿に基づいた検索やレコメンデーションを有効にできます。

Agent Search は、インポートしたデータから自動的にスキーマを検出します。あるいは、必要に応じてデータのスキーマを自分で指定することもできます。データのスキーマを指定すると、通常は結果の品質が向上します。

次のステップ

カスタム検索の場合:

カスタムレコメンデーションの場合:

メディアの構造化データ

メディアアプリは、メディアデータストアにのみ接続できます。メディアデータストアは、Google 定義のスキーマまたは独自のカスタムスキーマ（特定の 5 つのメディア関連フィールドを含む）を持つ構造化データストアです。スキーマの詳細については、メディアドキュメントとデータストアについてをご覧ください。

たとえば、映画カタログやニュースサイトのメディアレコメンデーションアプリを作成してレコメンデーションを有効にすると、ユーザーに適切なパーソナライズされた候補が表示されます。

メディアドキュメントに加えて、メディアデータストアには、Agent Search がユーザーのレコメンデーションと検索をカスタマイズできるようにするユーザーイベント情報も含まれています。メディアアプリにはユーザーイベントが必要です。ユーザーイベントについては、リアルタイムのユーザーイベントの記録をご覧ください。

次のステップ

メディアデータストアを作成します。
メディアアプリを作成する。

非構造化データ

非構造化データストアを使用すると、ドキュメントや画像などのデータに対してセマンティック検索を実行できます。

非構造化データストアでは、TXT、PDF、HTML、DOCX、PPTX、XLSX、XLSM 形式のドキュメントがサポートされます。

検索の結果として、10 個の URL と、自然言語クエリへの回答の要約が提供されます。ドキュメントは、適切なアクセス権限を持つ Cloud Storage バケットにアップロードされる必要があります。たとえば金融機関は、金融調査出版物を収めた自社の非公開コーパスに対する検索を有効にできます。また、バイオテクノロジー企業は、医療研究を収めた自社の非公開リポジトリに対する検索やレコメンデーションを実行できます。

次のステップ

検索の場合:

医療 FHIR データ

ヘルスケア検索アプリは、Cloud Healthcare API FHIR ストアからインポートされた FHIR R4 データを使用します。Agent Search でサポートされている FHIR R4 リソースのリストについては、Healthcare FHIR R4 データスキーマリファレンスをご覧ください。 FHIR R4 データを Agent Search データストアのデータソースとして使用するには、いくつかの要件を満たす必要があります。詳細については、取り込む医療 FHIR データを準備する方法をご覧ください。

次のステップ

統合検索について

統合検索アプリを作成すると、複数のデータストアを 1 つのカスタム検索アプリに接続できます。この機能を使用すると、1 つのアプリで複数のソースと複数の種類のデータにまたがって検索できます。

統合検索アプリを作成するには、新しいカスタム検索アプリを作成するときに複数のデータストアを選択します。作成時に複数のデータストアを選択しない場合、後でデータストアを追加することはできません。

検索結果を取得する際には、すべてのデータストアを検索することも、単一のデータストアの結果に絞り込むこともできます。

次の制限が適用されます。

データストアの追加と削除:
- アプリでの統合検索を有効にするには、アプリ作成時に少なくとも 2 つのデータストアをアプリに接続する必要があります。
- 統合検索アプリにデータストアを追加したり、データストアを削除したりできますが、アプリに接続されているデータストアの数を 2 つ未満にすることはできません。
- 検索アプリの作成時に 1 つのデータストアをアプリに接続した場合、後でデータストアを追加または削除することはできません。
ウェブサイトのデータストアを統合検索に使用するには、ウェブサイトの高度なインデックス登録を有効にする必要があります。詳しくは、ウェブサイトの高度なインデックス登録をご覧ください。
BigQuery を使ってインポートされた非構造化データを含むデータストアは、サポートされていません。
画像検索（ params フィールドで searchType: 1 を使用）はサポートされていません。
統合検索では、検索リクエストで次のフィールドを使用できます。
- boostSpec
- contentSearchSpec
- dataStoreSpecs
- facetSpecs
- filter
- languageCode
- offset
- oneBoxPageSize
- orderBy
- query
- pageSize
- pageToken
- relevanceScoreSpec
- relevanceThreshold
- session
- sessionSpec
- spellCorrectionSpec
- userInfo
- userPseudoId
統合検索では、 DataStoreSpecで次のフィールドを使用できます。
- dataStore
- boostSpec: SearchRequest と dataStoreSpecs の両方にブースト仕様が指定されている場合、両方のブースト仕様が検索結果に適用されます。
- filter: SearchRequest と dataStoreSpecs の両方にフィルタが指定されている場合、両方のフィルタが検索結果に適用されます。
統合アプリでは、サービス提供構成に対する作成、読み取り、更新、削除（CRUD）オペレーションがサポートされています。サービス提供構成では、次のフィールドだけを追加または更新できます。
- boostControlIds
- displayName
- filterControlIds
- genericConfig:
  - contentSearchSpec
- name
- solutionType
- synonymsControlIds
統合検索アプリでは、次のコントロールに対する CRUD オペレーションがサポートされています。
- boostAction
- synonymAction
- filterAction
検索アプリあたりのデータストア数の上限は 50 個です。
1 つのデータストアで CMEK 構成を使用している場合、他のすべてのデータストアでも同じ CMEK 構成を使用する必要があります。

アプリとデータストアについて コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

アプリとデータストアの関係

アプリ作成とデータの取り込みの方法

ドキュメント

データストアとアプリ

ウェブサイトのデータ

次のステップ

構造化データ

次のステップ

メディアの構造化データ

次のステップ

非構造化データ

次のステップ

医療 FHIR データ

次のステップ

統合検索について

アプリとデータストアについて