このページでは、構造化データ、メタデータを含む非構造化データ、またはカスタムの構造化属性を含むウェブサイトのデータ用にアプリを設定するスキーマ フィールドを構成する方法について説明します。
フィールド設定は、Vertex AI Search が結果でフィールドを使用する方法を決定するのに役立ちます。Google Cloud コンソールの [スキーマ] タブを使用して、フィールド設定を構成できます。
フィールド設定の構成は、構造化データまたはメタデータを含む非構造化データを含むデータストアがあるアプリでのみ使用できます。
フィールド設定
次のフィールド設定は、検索データまたはおすすめデータの多くのフィールド タイプで使用できますが、すべてのデータタイプで使用できるわけではありません。スキーマには、個々のフィールドの複数のフィールド設定が含まれています。次の表に、スキーマ内のフィールドに適用できる設定を示します。次のフィールド設定では、構造化データを使用することを強くおすすめします。
| 設定 | 定義 | 目的 | ユースケースの例 |
|---|---|---|---|
| インデックスを作成可能 | フィールドをインデックス可能に設定すると、ドキュメント内の構造化フィールドでフィルタリング、ブースト、ファセットなどのオペレーションが可能になります。
|
フィールドを フィールドを | ホテル データストアでは、hotel_chain などのフィールドをインデックス登録可能として設定できます。これにより、hotel_chain に対してランキング、フィルタリング、ブースト オペレーションを適用できます。たとえば、フィルタを適用して、フィルタされたホテル チェーンを含む検索結果のみが表示されるようにすることができます。 |
| 検索可能 | 検索に関連する可能性が最も高いフィールドは なお、検索可能に設定できるのは、テキスト値を含むフィールドのみです。したがって、数値の価格フィールドはインデックス登録可能(フィルタリングまたはファセット用)ですが、全文検索はできません。 | フィールドを [検索可能] に設定すると、検索クエリでそのフィールドの再現率が向上し、ユーザーはこれらのフィールド内のテキストをクエリして、ウェブページなどのコンテンツを見つけることができます。フィールドを検索可能としてマークすると、ランキングを適用できます。そのため、検索可能としてマークするフィールドが多すぎると、ランキング アルゴリズムが過飽和状態になり、結果が多すぎるため、検索精度に悪影響を及ぼす可能性があります。これにより、無関係な検索結果が返される可能性があります。 | インターネット サービス プロバイダのサポート チケット システムでは、各チケットが構造化されたドキュメントとして保存されます。これらのドキュメントに |
| 動的ファセット可能 | コンテキスト認識フィルタを提供して、ユーザーの検索をより適切にターゲット設定します。フィールドを Dynamic Facetable に設定すると、フィールドに存在する一意の値に基づいて、インタラクティブ フィルタ(ファセット)が自動的に生成されます。 |
フィールドを Dynamic
facetable に設定すると、ユーザーは取り込んだデータから直接導出されたカテゴリや属性を選択して、検索結果を動的に絞り込むことができます。可能なすべてのフィルタ オプションを手動で事前定義する必要はありません。これにより、ユーザーは検索対象を非常に具体的なウェブ コンテンツに絞り込むことができます。検索可能な 動的ファセット可能を使用すると、より良い結果が得られ、検索の再現率とユーザーに提供されるファセットの品質の両方が向上します。 |
人事ポリシーなどの社内ナレッジベースのページは、department、document_type、last_modified_date などのデータとともに取り込まれます。これらのフィールドに dynamic facetable のタグが付けられている場合、従業員が「経費精算」などの用語で検索すると、関連する検索結果に基づいてインタラクティブなフィルタが動的に生成されます。この場合、ウェブ インターフェースには、[部門: 財務、旅行]、[ドキュメント タイプ: ポリシー、よくある質問]、[最終更新日: 今四半期、昨年] などのファセットが表示されます。 |
| 取得可能 | 検索クエリが一致するコンテンツにヒットすると、検索エンジンは取得可能なフィールドの値をプルして、表示したりアプリケーションで使用したりできます。つまり、元のドキュメントの情報が検索結果の一部として表示されます。キーフィールド(ドキュメントの一意の識別子)は取得可能として設定されます。 | 取得可能なフィールドは、値を表示できるフィールドと、検索ロジックでのみ使用され、元の値がエンドユーザーに表示されないフィールドを区別することで、検索コンテキストを提供します。 | 販売者サイトでの商品検索では、product_id、name、price、image_url は、取得可能として設定する一般的なフィールドです。一方、internal_tracking_code は管理目的でのみインデックス登録とフィルタリングが可能ですが、一般公開の検索結果で取得することはできません。 |
| 完了可能 | フィールドの内容を検索クエリの候補として使用できるようにします。詳細については、予測入力を構成するをご覧ください。 | この設定により、ユーザーが入力したときにリアルタイムでクエリ候補を表示するために、そのフィールド内の値を使用できるようになります。この機能は、ユーザーが関連性の高いコンテンツを見つけやすくし、検索プロセスを高速化します。自然言語フィルタリングの使用などの特定の要因が、このパフォーマンスに影響する可能性があります。 | completable フィールドが product_name、brand、category に設定されている場合、ユーザーが「Tech」と入力すると、オートコンプリートの候補に次のようなものが表示されます。
|
| フィルタリング可能 | レコメンデーションでフィールドを使用して推奨結果をフィルタし、ユーザーに表示する検索結果を決定できるようにします。レコメンデーションのフィルタリングについては、レコメンデーションをフィルタリングするをご覧ください。 | フィールドを Filterable に設定すると、ユーザー向けのおすすめをカスタマイズできます。フィルタリングの上限が適用されることに注意してください。 |
言語とドラマでフィルタを設定すると、language_code: ANY("en", "fr") OR categories: ANY("drama") のようになります。 |
よく使用される設定の違い
「インデックス登録可能」、「検索可能」、「取得可能」のフィールド設定には、重要な違いがあります。これらの違いを次の表にまとめます。
| 機能 | インデックスを作成可能 | 検索可能 | 取得可能 |
|---|---|---|---|
| 主な役割 | フィールドの内容を検索エンジンで利用できるようにする | フィールド コンテンツに対する全文検索を許可します。 | フィールドの値を検索結果で返すことを許可します |
| 分析 | コンテンツが処理され、インデックスに格納されます。 | 通常、広範な語彙分析が行われます。 | 値は表示用にそのまま保存されます。 |
| Can it be... | |||
| ...検索可能ですか? | はい(前提条件であることが多い) | なし | 必ずしもそうではありません(検索可能でなくても取得できる場合があります)。 |
| ...取得可能ですか? | 必ずしもそうとは限りません | 必ずしもそうとは限りません。 | なし |
| ...フィルタ可能/並べ替え可能/ファセット可能ですか? | はい(通常、これらにも前提条件があります) | 直接はできません。これらは、インデックス可能なフィールドに基づいて構築されることが多い別個の属性です。 | 直接は関係ありません。これらの属性は、フィールドのインデックス登録とクエリの方法に関連しており、表示方法だけに関連しているわけではありません。 |
実際には、ユーザー エクスペリエンスに不可欠な多くのフィールド(タイトル、説明、識別情報など)は、indexable、searchable、retrievable に設定されることがよくあります。
制限事項
フィールド設定には次の制限があります。
- 最大 50 個のフィールドを、インデックスを作成可能、検索可能、取得可能、動的ファセット可能として構成できます。
- フィールドを動的ファセット可能として構成するには、まずインデックス登録可能として構成する必要があります。
- インデックスを作成可能な設定を変更するには、データのインデックスを再登録する必要があります。特に大規模なデータストアの場合、この処理に数時間かかることがあります。
メディア検索アプリのフィールドを構成していて、スキーマのフィールドに関する詳細情報が必要な場合は、メディア ドキュメントとデータストアについてをご覧ください。
フィールド設定を更新する
フィールド設定を更新するには:
Google Cloud コンソールで、[AI Applications] ページに移動します。
編集するアプリの名前をクリックします。
[データ] をクリックします。
[スキーマ] タブをクリックします。このタブには、現在のフィールド設定が表示されます。
データストアに基本的なウェブサイト データやメタデータのない非構造化データが含まれている場合、[スキーマ] タブは表示されません。
[編集] をクリックします。
更新する必要があるフィールド設定を選択または選択解除します。一部のフィールド設定はサポートされていません。たとえば、数値フィールドを [検索可能] に設定することはできません。
[保存] をクリックして変更を適用します。