自然言語理解でフィルタする

このページでは、自然言語理解を適用して検索クエリのフィルタを自動的に作成し、返される結果の品質を向上させる方法について説明します。

この機能は、構造化データストアに接続されている検索アプリで使用できます。

自然言語クエリの理解について

構造化データを含むカスタム検索アプリがある場合、ユーザーの自然言語クエリをフィルタされたクエリとして再フォーマットできます。これにより、クエリ文字列内の単語を検索するよりも質の高い検索結果が得られる可能性があります。

たとえば、"Find a coffee shop serving banana bread" などの自然言語クエリは、クエリとフィルタ "query": "banana bread", "filter": "type": ANY(\"cafe\") として再定義される場合があります。

自然言語クエリの理解を使用する方が、独自のフィルタ式を作成するよりも簡単で柔軟です。フィルタ式を作成する方法については、構造化データまたは非構造化データのカスタム検索をフィルタするをご覧ください。

ハードフィルタとソフトフィルタ

自然言語クエリ理解に適用できるフィルタには、ハードとソフトの 2 種類があります。

難しい。デフォルトでは、抽出されたフィルタは、結果が返されるために満たす必要のある必須条件として適用されます。

動作は、検索リクエストの filter フィールドに似ています。
ソフト。ハードフィルタの代替手段として、検索結果にブーストを適用する方法があります。ブーストされた結果が返される可能性が高くなりますが、ブースト条件を満たさない結果も返される可能性があります。

動作は、検索リクエストの boostSpec フィールドに似ています。

両方のタイプのフィルタを試すことができます。検索結果が十分に返されない場合は、ハードフィルタではなくソフトフィルタを試してください。

ソフトフィルタを適用する方法については、下記のソフトフィルタで検索するをご覧ください。

例

この機能は、例で説明するのが最適です。

例: クエリからのフィールド抽出（ハードフィルタ）は、クエリから抽出されたフィールドフィルタを示しています。
例: 位置情報フィルタ（ハードフィルタ）を使用する場合には、位置情報フィルタの特殊なケースが含まれます。
例: クエリからのフィールド抽出（ソフトフィルタ）は、ブレンドアプリに対して行われたクエリから抽出されたソフトフィルタを示しています。

例: クエリからのフィールド抽出（ハードフィルタ）

この自然言語クエリ理解機能は、ホテルの検索の例で説明されています。

ホテルサイトの構造化データストアに対して行われた次のクエリを考えてみましょう。「1 泊 300 未満で、4 つ星以上の子供連れ向けホテルを探してください。犬を連れて行きたいですし、無料 Wi-Fi　が必要です。」

自然言語クエリの理解がない場合、検索アプリはクエリ内の単語を含むドキュメントを探します。

自然言語クエリの理解と適切に構造化されたデータにより、クエリ内の自然言語の一部をフィルタに置き換えることで、検索の効率性が向上します。構造化データに star_rating（数値）、price（数値）、amenities（文字列）のフィールドがある場合、クエリは次のフィルタを含むように作成できます。

   {
       "star_rating": >=4,
       "price": <=300,
       "amenities": "Wifi", "Pets Allowed"
   }

例: 位置情報フィルタ（ハードフィルタ）を使用する場合

この例は前の例と似ていますが、位置情報フィルタが含まれている点が異なります。これは、特別な種類の抽出フィルタです。Vertex AI Search には、クエリ内の場所を認識し、その場所の近接フィルタを作成する機能があります。

州全体のビジネスサイトに対して行われた次のクエリを考えてみましょう。「サンフランシスコにある、4 つ星以上のシックでスタイリッシュなホテルを探してください。」

自然言語クエリの理解と位置情報フィルタにより、検索は、サンフランシスコから半径 10 km 以内にある 4 つ星以上のホテルを対象とする次のフィルタを含むように再定義されます。

   {
       "star_rating": >=4,
       "location": GEO_DISTANCE(\"San Francisco, CA\", 10000)
   }

この例では、GEO_DISTANCE は住所ですが、元のクエリに住所が含まれていても、他のクエリでは緯度と経度として記述されることがあります。

例: クエリからのフィールド抽出（ソフトフィルタ）

この自然言語クエリ理解機能は、ホテルの検索の例で説明されていますが、すべての条件を満たしていない結果も表示されます。

旅行サイトに対して行われた次のクエリを考えてみましょう。「1 泊 300 ドル以下で、犬を連れて行ける、4 つ星以上の家族向けのホテルを探してください。」

自然言語クエリの理解と適切に構造化されたデータにより、クエリ内の自然言語の一部をソフトフィルタに置き換えることで、検索の効率性が向上します。構造化データに star_rating（数値）、price（数値）、amenities（文字列）のフィールドがある場合、クエリは次のブーストとして書き換えることができます。

自然言語クエリから抽出されたブースト条件:

{
  "boostSpec": {
    "conditionBoostSpecs": {
      "condition": "(star_rating >= 4.5) AND (price < 200) AND ANY(amenities, \"Pets Allowed\")",
      "boost": 0.7
    }
  }
}

この場合、評価の低いホテルやペット不可のホテルが返されることがあります。

ブーストの強度は、ドキュメントが一致する構造化フィルタの数によって異なります。3 つの条件が抽出され、ドキュメントが 1 つの条件のみに一致する場合、ドキュメントのブーストは小さくなります。また、ドキュメントが 3 つの条件すべてを満たしている場合は、強いブーストが適用されます。

制限事項

自然言語クエリの理解には次の制限が適用されます。

自然言語クエリの理解は、統合検索アプリには適用できません。統合検索アプリで自然言語クエリの理解を使用すると、エラーが発生します。
自然言語クエリの理解は、構造化データストアを使用するカスタム検索アプリでのみ機能します。
自然言語クエリの理解を使用するとレイテンシが増加するため、レイテンシが問題になる場合は使用しないことを選択できます。
位置情報の場合は、場所を明示的に記述する必要があります。「近くの」や「自宅」などの位置情報は使用できません。
位置情報の半径は 10 km で、構成できません。
ブール値フィールドはフィルタでは使用できません。たとえば、クエリが「禁煙のホテルの部屋を探して」の場合、"non_smoking": true などのブール値フィールドは役に立ちませんが、"non_smoking": "YES" などの文字列フィールドはフィルタの一部として使用できます。

始める前に

自然言語クエリの理解の使用を開始する前に、使用する予定のアプリに接続されている構造化データストアで有効にする必要があります。

自然言語クエリの理解を有効にする手順は次のとおりです。

REST

データストア ID を確認します。データストア ID がすでにある場合は、次のステップに進みます。
1. Google Cloud コンソールで、[AI アプリケーション] ページに移動し、ナビゲーションメニューで [データストア] をクリックします。
  
  [データストア] ページに移動
2. データストアの名前をクリックします。
3. データストアの [データ] ページで、データストア ID を取得します。

次の curl コマンドを実行します。

curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID?update_mask=natural_language_query_understanding_config.mode" \
-d '{
      "naturalLanguageQueryUnderstandingConfig": {
        "mode": "ENABLED"
      }
    }'

次のように置き換えます。

PROJECT_ID: 実際の Google Cloud プロジェクト ID。
DATA_STORE_ID: Vertex AI Search データストアの ID。

コマンドとレスポンスの例

curl -X PATCH
-H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
-H "X-Goog-User-Project: my-project-123"
"https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/dataStores/my-data-store?update_mask=natural_language_query_understanding_config.mode"
-d '{
       "naturalLanguageQueryUnderstandingConfig": {
         "mode": "ENABLED"
       }
    }'

{
  "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store",
  "displayName": "test_data_store",
  "industryVertical": "GENERIC",
  "createTime": "2024-07-10T18:50:01.673414Z",
  "solutionTypes": [
    "SOLUTION_TYPE_SEARCH"
  ],
  "defaultSchemaId": "default_schema",
  "documentProcessingConfig": {
    "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-data-store/documentProcessingConfig",
    "defaultParsingConfig": {
      "digitalParsingConfig": {}
    }
  },
  "servingConfigDataStore": {},
  "naturalLanguageQueryUnderstandingConfig": {
    "mode": "ENABLED"
  }
}

データストアごとに手順 1 と 2 を繰り返します。
約 24 時間待ちます。

データストアの準備が整う前に自然言語クエリの理解を使用しようとすると、filterExtractionCondition が DISABLED に設定されている場合と同じレスポンスが返されます。

検索、自然言語クエリをフィルタに変換する

自然言語のクエリで検索し、自然言語クエリ用に最適化された結果を取得する手順は次のとおりです。

REST

次の curl コマンドを実行します。このコマンドは search メソッドを呼び出します。

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED"
        }
      }'

次のように置き換えます。

PROJECT_ID: 実際の Google Cloud プロジェクト ID。
APP_ID: クエリする Vertex AI Search アプリの ID。アプリは、構造化データを含むデータストアに接続されている必要があります。統合検索アプリは使用できません。
QUERY: 自然言語で記述されたクエリ。

コマンドの例と部分的な結果

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED"}
}'

{
"results": [
{
  "id": "b2617d862",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
    ...
  }
},
{
  "id": "a51841841",
  "document": {
    "name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
    ...
  }
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(amenities: ANY(\"Pets Allowed\") AND amenities: ANY(\"Wifi\") AND star_rating: >= 4 AND price: < 300)",
"extractedFilterStructured": {
  "expression": {
    "andExpr": {
      "expressions": [
        {
          "numberConstraint": {
            "fieldName": "star_rating",
            "value": 4,
            "comparison": "GREATER_THAN_EQUALS",
          }
        },
        {
          "numberConstraint": {
            "fieldName": "price",
            "value": 300,
            "comparison": "LESS_THAN",
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Pets Allowed"]
          }
        },
        {
          "stringConstraint": {
            "fieldName": "amenities",
            "any": ["Wifi"]
          }
        },
      ]
    }

検索、クエリ内の場所を位置情報フィルタに変換

自然言語のクエリで検索し、自然言語クエリに最適化された結果（場所の近接性など）を取得するには、次の操作を行います。

REST

次の curl コマンドを実行します。このコマンドは search メソッドを呼び出します。

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "geoSearchQueryDetectionFieldNames": ["GEO_FIELD_NAME_1", "GEO_FIELD_NAME_N"]"
        }
      }'

次のように置き換えます。

PROJECT_ID: 実際の Google Cloud プロジェクト ID。
APP_ID: クエリする Vertex AI Search アプリの ID。アプリは、構造化データを含むデータストアに接続されている必要があります。統合検索アプリは使用できません。
QUERY: 自然言語で記述されたクエリ。
GEO_FIELD_NAME_1, GEO_FIELD_NAME_N: geolocation 型の値のリスト。値の型が geolocation でない場合、このフィールドは無視されます。

コマンドの例と結果

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
-H "Content-Type: application/json"
"https://discoveryengine.googleapis.com/v1/projects/123456
/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
-d '{
"query": "Find me a chic and stylish hotel with at least 4 stars that is in San Francisco.",
"naturalLanguageQueryUnderstandingSpec": {
  "filterExtractionCondition": "ENABLED",
  "geoSearchQueryDetectionFieldNames": ["location"]}
}'

{
"results": [
{
"id": "b2617d862",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/b2617d862",
...
}
},
{
"id": "a51841841",
"document": {
"name": "projects/123456/locations/us/collections/default_collection/dataStores/my-data-store/branches/0/documents/a51841841",
...
}
}
],
"naturalLanguageQueryUnderstandingInfo": {
"extractedFilters": "(star_rating: >= 4 AND GEO_DISTANCE("location", "San Francisco", 10000))",
"extractedFilterStructured": {
"expression": {
"andExpr": {
  "expressions": [
    {
      "numberConstraint": {
        "fieldName": "star_rating",
        "value": 4,
        "comparison": "GREATER_THAN_EQUALS",
      }
    },
    {
      "geolocationConstraint": {
        "fieldName": "location",
        "address": "San Francisco",
        "radius_in_meters": 10000,
      }
    },
  ]
}

ソフトフィルタで検索する

ソフトフィルタを適用する手順は次のとおりです。

REST

アプリ ID を調べます。アプリ ID をすでに保有している場合は、次のステップに進みます。
1. Google Cloud コンソールで、[AI アプリケーション] ページに移動します。
  
  [アプリ] に移動
2. [アプリ] ページで、アプリの名前を見つけ、[ID] 列からアプリの ID を取得します。

次の curl コマンドを実行します。このコマンドは search メソッドを呼び出します。

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

次のように置き換えます。

PROJECT_ID: 実際の Google Cloud プロジェクト ID。
APP_ID: 検索アプリの ID。アプリは、構造化データを含むデータストアに接続されている必要があります。統合検索アプリは使用できません。
QUERY: 自然言語のクエリ。

コマンドと部分的なレスポンスの例

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search" \
  -d '{
        "query": "Find me a family-friendly hotel with at least four stars that costs less than 300 a night, lets me bring my dog, and has free Wi-Fi.",
        "naturalLanguageQueryUnderstandingSpec": {
          "filterExtractionCondition": "ENABLED",
          "extractedFilterBehavior": "SOFT_BOOST"
        }
      }'

{
  "results": [
    {
      "id": "4246fcb660e398908bcd3007d9863ef8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/4246fcb660e398908bcd3007d9863ef8",
        "id": "4246fcb660e398908bcd3007d9863ef8",
        "structData": {
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "available_date": "2023-11-14",
          "amenities": [
            "Pet Friendly",
            "Pool",
            "Free Wi-Fi",
            "Bar"
          ],
          "location": {
            "zip_code": "23941",
            "country": "USA",
            "city": "South Amber",
            "state": "NH",
            "address": "2304 Nicholas Fort, Moorechester, MI 20090"
          },
          "id": 262,
          "contact": {
            "email": "eric59@example.com",
            "phone": "316-868-8020x2693"
          },
          "price_per_night": 112.48,
          "title": "Houston-Tran",
          "rating": 1.5
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true"
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.7236669,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.id",
            "value": 262
          },
          {
            "name": "c.rating",
            "value": 1.5
          },
          {
            "name": "c.price_per_night",
            "value": 112.48
          }
        ]
      }
    },
    {
      "id": "d729812e97b224b7a812e9ad0240ca3e",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/d729812e97b224b7a812e9ad0240ca3e",
        "id": "d729812e97b224b7a812e9ad0240ca3e",
        "structData": {
          "location": {
            "address": "38107 Mays Extension Apt. 070, Steventon, DC 31453",
            "state": "MA",
            "country": "USA",
            "zip_code": "25856",
            "city": "New Laura"
          },
          "title": "Serrano, Jackson and Carr",
          "available_date": "2024-04-05",
          "room_types": [
            "Single",
            "Deluxe",
            "Single"
          ],
          "price_per_night": 188.87,
          "contact": {
            "email": "knavarro@example.com",
            "phone": "(089)882-8916"
          },
          "id": 66,
          "rating": 4.3,
          "amenities": [
            "Pet Friendly",
            "Gym",
            "Pool",
            "Free Wi-Fi"
          ]
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0,
          "clearbox_escorer_score": 0.76363050937652588
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.7108109,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.id",
            "value": 66
          },
          {
            "name": "c.rating",
            "value": 4.3
          },
          {
            "name": "c.price_per_night",
            "value": 188.87
          }
        ]
      }
    },
    {
      "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/67e4484d2e6bf30bd3aa5229058cf3ad",
        "id": "67e4484d2e6bf30bd3aa5229058cf3ad",
        "structData": {
          "rating": 4.6,
          "room_types": [
            "Double",
            "Single",
            "Deluxe"
          ],
          "title": "Spencer-Small",
          "id": 249,
          "amenities": [
            "Pet Friendly",
            "Free Wi-Fi",
            "Pet Friendly",
            "Restaurant"
          ],
          "price_per_night": 66.38,
          "contact": {
            "phone": "+1-176-057-5439x71337",
            "email": "mike26@example.com"
          },
          "location": {
            "zip_code": "37354",
            "state": "WY",
            "city": "Port James",
            "address": "52979 Linda Orchard, New Ashley, GA 22405",
            "country": "USA"
          },
          "available_date": "2024-04-10"
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.71184474,
        "boostingFactor": 0,
        "defaultRank": 3,
        "customSignals": [
          {
            "name": "c.id",
            "value": 249
          },
          {
            "name": "c.rating",
            "value": 4.6
          },
          {
            "name": "c.price_per_night",
            "value": 66.38
          }
        ]
      }
    },
    ...
    {
      "id": "53d468f88b0d87b29bff51f8784d91a8",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/53d468f88b0d87b29bff51f8784d91a8",
        "id": "53d468f88b0d87b29bff51f8784d91a8",
        "structData": {
          "contact": {
            "email": "bradley29@example.com",
            "phone": "404.120.7687x62482"
          },
          "price_per_night": 68.66,
          "rating": 3.3,
          "amenities": [
            "Restaurant",
            "Bar",
            "Pet Friendly",
            "Pool"
          ],
          "id": 25,
          "room_types": [
            "Suite",
            "Suite",
            "Double"
          ],
          "available_date": "2024-05-15",
          "title": "Wilson-Ward",
          "location": {
            "city": "East Sheila",
            "country": "USA",
            "state": "TX",
            "zip_code": "34921",
            "address": "60458 Fleming Freeway, South Holly, ME 64008"
          }
        },
        "derivedStructData": {
          "is_exact_match_query": 0,
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0,
        "semanticSimilarityScore": 0.70549995,
        "boostingFactor": 0,
        "defaultRank": 49,
        "customSignals": [
          {
            "name": "c.id",
            "value": 25
          },
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.price_per_night",
            "value": 68.66
          }
        ]
      }
    },
    {
      "id": "653c16be81e88e23d694db625e474881",
      "document": {
        "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/653c16be81e88e23d694db625e474881",
        "id": "653c16be81e88e23d694db625e474881",
        "structData": {
          "price_per_night": 443.9,
          "amenities": [
            "Pool",
            "Free Wi-Fi",
            "Parking",
            "Beach Access"
          ],
          "contact": {
            "email": "jamesblackburn@example.com",
            "phone": "155.107.3771"
          },
          "available_date": "2024-02-25",
          "id": 279,
          "room_types": [
            "Deluxe",
            "Penthouse",
            "Single"
          ],
          "title": "Wolf, Williams and Jenkins",
          "rating": 3.1,
          "location": {
            "address": "904 Kimberly Alley, Lake Aprilchester, WI 31242",
            "zip_code": "23652",
            "state": "SD",
            "country": "USA",
            "city": "Cunninghamside"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.76363050937652588,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7636305,
        "semanticSimilarityScore": 0.69835776,
        "boostingFactor": 0,
        "defaultRank": 50,
        "customSignals": [
          {
            "name": "c.id",
            "value": 279
          },
          {
            "name": "c.rating",
            "value": 3.1
          },
          {
            "name": "c.price_per_night",
            "value": 443.9
          }
        ]
      }
    }
  ],
  "totalSize": 106,
  "attributionToken": "mAL0FwEKDAiJ_4nIBhDH28e5ARIkNjkwMzk4ODktMDAwMC0yNGQ4LWJmYzEtMTRjMTRlZjFiNjcwIgdHRU5FUklDKkiVksUwjr6dFZ_Wty27kfoxvpH6MbaqojKugJM34-uQN9PaiTeQ97IwwvCeFdSynRXg65A3nNa3Lbe3jC2OkckwuaqiMtDaiTcwAVKMAXByb2plY3RzLzc1NjIwNjYwODQ3OS9sb2NhdGlvbnMvZ2xvYmFsL2NvbGxlY3Rpb25zL2RlZmF1bHRfY29sbGVjdGlvbi9lbmdpbmVzL2hvdGVscy1tYW55LXNlYXJjaF8xNzI0NDUyMzYwMzU2L3NlcnZpbmdDb25maWdzL2RlZmF1bHRfc2VhcmNo",
  "nextPageToken": "AzN2IWMmVGNxMGNx0SMjZmYtgDZ0ITLwADMw0CO4gTOzATO2QiGC8O-7WMEGgcmorICMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
    "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {},
  "naturalLanguageQueryUnderstandingInfo": {
    "extractedFilters": "(rating\u003e=4 AND price_per_night\u003c300 AND amenities: ANY(\"Pet Friendly\") AND amenities: ANY(\"Free Wi-Fi\"))",
    "structuredExtractedFilter": {
      "expression": {
        "andExpr": {
          "expressions": [
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Pet Friendly"
                ],
                "querySegment": "lets me bring my dog"
              }
            },
            {
              "stringConstraint": {
                "fieldName": "amenities",
                "values": [
                  "Free Wi-Fi"
                ],
                "querySegment": "free Wi Fi"
              }
            },
            {
              "numberConstraint": {
                "fieldName": "rating",
                "comparison": "GREATER_THAN_EQUALS",
                "value": 4
              }
            },
            {
              "numberConstraint": {
                "fieldName": "price_per_night",
                "comparison": "LESS_THAN",
                "value": 300
              }
            }
          ]
        }
      }
    }
  }
}

次のコマンド例では、フィルタの動作を SOFT_BOOST に設定し、デフォルトの HARD_FILTER をオーバーライドします。

自然言語クエリのフィールドを指定する

自然言語クエリ理解でフィールドをフィルタとして使用するには、スキーマでインデックス登録可能としてマークされている必要があります。（スキーマの表示と編集に関する一般的な情報については、スキーマを更新するをご覧ください）。

Vertex AI Search は、スキーマ内のインデックス登録可能なフィールドのうち、自然言語クエリ理解フィルタで使用するのに適したフィールドを特定します。ただし、不要なフィールドが含まれている場合は、使用できるフィールドを指定する許可リストを作成する必要があります。

ホテル予約サイトを考えてみましょう。このサイトには、amenities、id、price_per_night、rating、room_types などのフィールドがあります。このうち、id が文字と数字の文字列である場合、Vertex AI Search は自然言語クエリの理解に使用されるフィールドから除外する可能性があります。

ただし、Vertex AI Search が除外すべきフィールドを除外していないために、クエリ結果の品質が低い場合は、使用できるフィールドを指定する必要があります。たとえば、ホテルスキーマに renovation_status のフィールドがあり、顧客にとって有用ではなく、ホテルチェーンにとって都合の悪い情報が含まれている場合は、許可されるフィールドのリストから除外できます。

ホテルデータの構造化データストアのレコードの例。

{
  "title": "Miller-Jones",
  "rating": 1.7,
  "price_per_night": 115.16,
  "id": 2902,
    …
  ],
  "amenities": [
    "Spa",
    "Parking",
    "Restaurant"
    …
  ],
  "renovation_status": "Restaurant and spa renovation planned for 2027"
}

この例のフィールドに適した許可リストは ["amenities", "price_per_night", "rating", "title"] です。リストに renovation_status がありません。

検索で自然言語クエリの理解に使用できるフィールドの許可リストを指定するには、次の操作を行います。

REST

アプリ ID を調べます。アプリ ID をすでに保有している場合は、次のステップに進みます。
1. Google Cloud コンソールで、[AI アプリケーション] ページに移動します。
  
  [アプリ] に移動
2. [アプリ] ページで、アプリの名前を見つけ、[ID] 列からアプリの ID を取得します。

次の curl コマンドを実行します。このコマンドは search メソッドを呼び出します。

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
  -d '{
        "query": "QUERY",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["FIELD_1", "FIELD_2"],
    }
  }'

次のように置き換えます。

PROJECT_ID: 実際の Google Cloud プロジェクト ID。
APP_ID: 検索アプリの ID。アプリは、構造化データを含むデータストアに接続されている必要があります。統合検索アプリは使用できません。
QUERY: 自然言語のクエリ。
FIELD_N: 自然言語クエリの理解に使用できるスキーマ内のインデックス可能なフィールド。

コマンドと部分的なレスポンスの例

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)"
  -H "Content-Type: application/json"
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_search:search"
  -d '{
        "query": "A hotel with beach access for less than $150 a night.",
        "naturalLanguageQueryUnderstandingSpec": {
          "allowedFieldNames": ["amenities", "price_per_night", "rating"]
        }
  }'

{
  "results": [
    {
      "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/8dbf32e3e8d289c30a7c70bf4ba68bac",
        "id": "8dbf32e3e8d289c30a7c70bf4ba68bac",
        "structData": {
          "rating": 3.2,
          "location": {
            "city": "Jessicastad",
            "country": "USA",
            "zip_code": "18285",
            "state": "IA",
            "address": "552 Martin Gateway Apt. 964, Christinebury, OR 41179"
          },
          "contact": {
            "phone": "001-446-555-2265x7190",
            "email": "edwardscameron@example.com"
          },
          "amenities": [
            "Parking",
            "Beach Access",
            "Spa"
          ],
          "room_types": [
            "Double",
            "Deluxe",
            "Single"
          ],
          "id": 59,
          "title": "Williams, Richmond and Williams",
          "price_per_night": 143,
          "available_date": "2025-06-06"
        },
        "derivedStructData": {
          "clearbox_escorer_score": 0.77886492013931274,
          "can_fetch_raw_content": "true",
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.71246886,
        "boostingFactor": 0,
        "defaultRank": 1,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.2
          },
          {
            "name": "c.id",
            "value": 59
          },
          {
            "name": "c.price_per_night",
            "value": 143
          }
        ]
      }
    },
    ...
    {
      "id": "fd5f0b4125a9c52420510aa1aa52eaff",
      "document": {
      "name": "projects/123456/locations/global/collections/default_collection/dataStores/my-app/branches/0/documents/fd5f0b4125a9c52420510aa1aa52eaff",
        "id": "fd5f0b4125a9c52420510aa1aa52eaff",
        "structData": {
          "amenities": [
            "Beach Access",
            "Spa",
            "Gym",
            "Pet Friendly"
          ],
          "room_types": [
            "Queen",
            "King",
            "Suite"
          ],
          "id": 277,
          "title": "Wyatt, Thomas and Price",
          "available_date": "2023-11-17",
          "contact": {
            "phone": "9745551788",
            "email": "shermandaniel@example.com"
          },
          "rating": 3.3,
          "price_per_night": 139.18,
          "location": {
            "address": "05952 Elaine Freeway, Lake Timothychester, MD 69485",
            "country": "USA",
            "state": "DC",
            "city": "North Marcusmouth",
            "zip_code": "23129"
          }
        },
        "derivedStructData": {
          "can_fetch_raw_content": "true",
          "clearbox_escorer_score": 0.77886492013931274,
          "is_exact_match_query": 0
        }
      },
      "rankSignals": {
        "keywordSimilarityScore": 0.7788649,
        "semanticSimilarityScore": 0.7304497,
        "boostingFactor": 0,
        "defaultRank": 2,
        "customSignals": [
          {
            "name": "c.rating",
            "value": 3.3
          },
          {
            "name": "c.id",
            "value": 277
          },
          {
            "name": "c.price_per_night",
            "value": 139.18
          }
        ]
      }
    }
  ],
  "totalSize": 17,
  "attributionToken": "lwL0FgEKCwj__drHBhCzzZdSEiQ2OTAwYTgzZC0wMDAwLTI5YzYtYjliMi03NDc0NDYzYjVjY2QiB0dFTkVSSUMqSJWSxTCQ97IwwvCeFZ_Wty25qqIy0NqJN9PaiTeugJM31LKdFY6-nRWc1rct4-uQN7e3jC2-kfoxjpHJMLuR-jG2qqIy4OuQNzABUowBcHJvamVjdHMvNzU2MjA2NjA4NDc5L2xvY2F0aW9ucy9nbG9iYWwvY29sbGVjdGlvbnMvZGVmYXVsdF9jb2xsZWN0aW9uL2VuZ2luZXMvaG90ZWxzLW1hbnktc2VhcmNoXzE3MjQ0NTIzNjA3NTYvc2VydmluZ0NvbmZpZ3MvZGVmYXVsdF9zZWFyY2g",
  "nextPageToken": "Q2YjVjYzYDN0cDN30iMiljYtYzY5ITLwADMw0yYzgTYwATO2QiGB0ZxBPIEGcs6m_PCMIBM1IgC",
  "guidedSearchResult": {},
  "summary": {},
  "appliedControls": [
  "projects/123456/locations/global/collections/default_collection/engines/my-app/controls/secondbb"
  ],
  "queryExpansionInfo": {}
}

このコマンド例では、amenities、price_per_night、rating の各フィールドを自然言語クエリフィルタで使用できます。

自然言語理解でフィルタする コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

自然言語クエリの理解について

ハードフィルタとソフトフィルタ

例

例: クエリからのフィールド抽出（ハードフィルタ）

例: 位置情報フィルタ（ハードフィルタ）を使用する場合

例: クエリからのフィールド抽出（ソフトフィルタ）

制限事項

始める前に

REST

コマンドとレスポンスの例

検索、自然言語クエリをフィルタに変換する

REST

コマンドの例と部分的な結果

検索、クエリ内の場所を位置情報フィルタに変換

REST

コマンドの例と結果

ソフト フィルタで検索する

REST

コマンドと部分的なレスポンスの例

自然言語クエリのフィールドを指定する

REST

コマンドと部分的なレスポンスの例

自然言語理解でフィルタする

ソフトフィルタで検索する