注: Vertex AI Search は Agent Search に名称変更されます。現在、新しいブランディングを反映するようにコンテンツの更新を進めています。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

エージェント型検索を使用して回答をストリーミングする

このページでは、エージェントによる検索について説明し、ストリーミング回答メソッドで使用する方法について説明します。

エージェントによる検索について

stream answers メソッドで使用されるエージェント検索では、特定のユースケースでより良い結果を得ることができます。たとえば、複数のデータストアを持つアプリでマルチパス検索を有効にしたり、さまざまなクラスのクエリに対して回答の生成をカスタマイズしたりできます。

エージェントベースの検索を使用すると、アプリの複雑さが増しますが、その代わりに結果をより細かく制御できます。

エージェント検索には、検索エンジンの動作をカスタマイズするために使用できる事前定義されたエージェントが含まれています。これにより、エージェント取得なしでアプリの構成 UI またはストリーミング回答メソッドで利用できるよりも多くのカスタマイズが可能になります。

エージェントによる検索とエージェントなしの検索を組み合わせた検索

エージェントによる検索は、ブレンド検索アプリで特に役立ちます。エージェントベースの検索がない場合、検索では、すべてのデータストアに一度にクエリを実行するシングルパスファンアウトが使用されます。一方、エージェント型検索では、マルチパス検索が可能です。エージェントは検索を順番に計画して実行し、各ステップに最適なツールを選択します。複数のエージェント検索データストアの結果を結合し、Google 検索や Google マップなどのツールも使用できます。

たとえば、グローバルな会社ポリシーと地域オフィスの詳細に別々のデータストアがある場合です。ユーザーが「東京オフィスのコンプライアンスルールは何ですか？」と質問します。

エージェントによる取得なし: クエリ文字列全体を使用して、ポリシーストアと地域オフィスストアの両方に同時にクエリを実行します。これにより、結果が断片化される可能性があります。
エージェントによる検索: エージェントが実行を計画します。まず、リージョンストアから東京オフィスの詳細を取得します。次に、その特定のコンテキストを使用して、ポリシーストアで 2 回目のターゲット検索を実行します。

エージェントはこれらの結果を統合し、一貫性があり、より正確な回答を生成します。

また、エージェントベースの検索では、ブレンド検索アプリでマルチターンの検索クエリ（フォローアップの質問）を実行することもできます。エージェントベースの検索がない場合、複数ターンの検索は単一のデータストアアプリでのみ機能します。複数のターンにわたって会話コンテキストを永続化するには、必要に応じて、エージェントによる検索を Agent Platform セッションとペア設定します。

カスタムクエリの分類

回答メソッドとストリーミング回答メソッドは、ADVERSARIAL_QUERY と NON_ANSWER_SEEKING_QUERY の 2 つのクエリ分類タイプを提供します。

エージェントによる検索では、ビジネスワークフローに合わせて追加の分類タイプを定義できます。システムは分類器を使用してユーザーの意図を判断し、リクエストを適切なエージェント構成に転送します。

たとえば、クエリから、クエリの目的が注文の追跡であると判断し、TRACK_ORDER 分類を指定したとします。システムは、すべてのデータストアに対して一般的な検索を実行するのではなく、配送状況の取得に必要なツールとデータを備えた専用のエージェントを読み込みます。

エージェントによる検索を有効にして使用する方法

エージェントによる検索を有効にする方法は 2 つあります。

事前定義された Google 回答エージェント: エージェント検索に検索アプリがすでに存在する場合は、アプリにクエリを送信するときに API リクエストで enable_agent_invocation=true を設定することで、エージェントによる検索を有効にできます。この場合、既存の検索サービング構成は維持されます。
カスタム AI モードアプリ: エージェント検索アプリを作成するときに、別のタイプのサービス構成（default_agent_answer サービス構成）を定義します。エージェント検索では「アプリ」と「エンジン」が同じ意味で使用されるため、カスタム AI モードエンジンと呼ばれることもあります。

始める前に

エージェントによる検索を使用する前に、次の操作を行います。

複数ターンのセッション用に推論エンジンを設定する
省略可: カスタム AI モードアプリを設定する

マルチターンのセッション用に推論エンジンを設定する

複数のターンにわたって会話のコンテキストを保持するには、Gemini Enterprise Agent Platform で Agent Runtime エンジン（推論エンジンとも呼ばれます）を作成する必要があります。

streamAnswer リクエストを行うときは、Agent Runtime のリソース名を streamAnswer リクエストの reasoningEngine フィールドとして渡します。

Google Cloud プロジェクトで Agent Platform を有効にします。
Agent Engine REST API（または Agent Development Kit）を使用して、Agent Runtime インスタンス（推論エンジンとも呼ばれます）を作成します。このインスタンスは、streamAnswer メソッドで使用されるセッションをホストします。

インスタンスリソース名の形式は次のとおりです。
```
projects/PROJECT_NUMBER/locations/LOCATION_ID/reasoningEngines/REASONING_ENGINE_ID
```
Discovery Engine サービスアカウントに roles/aiplatform.reasoningEngineServiceAgent ロールを付与して、Discovery Engine サービスエージェントに推論エンジンへのアクセス権を付与します。
```
service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com
```
ここで、PROJECT_NUMBER は推論エンジンをホストするプロジェクトの番号です。この権限により、ストリーミング回答バックエンドは、ユーザーに代わってセッションのイベントを作成、読み取り、追加できます。
該当する割り当てを確認します。Agent Runtime によってバックアップされたセッションは、Agent Platform API から割り当てを消費します。対象となる割り当ては次のとおりです。
- aiplatform.googleapis.com/session_write_requests - 1 分あたりの Agent Runtime セッションの作成、削除、更新回数。
- aiplatform.googleapis.com/session_event_append_requests - 1 分あたりの Agent Runtime セッションへのイベントの追加回数。
詳細については、Gemini Enterprise Agent Platform Agent Engine の割り当てをご覧ください。
streamAnswer リクエストの reasoningEngine フィールドとして渡す必要があるため、エージェントランタイムリソース名をメモします。

省略可: カスタム AI モードアプリを設定する

デフォルトでは、エージェントベースの検索は事前定義された Google 回答エージェントを使用します。このクラスは、クエリをインテント DEFAULT_ANSWER_SEEKING と DO_NOT_ANSWER に分類します。ツールをカスタマイズしたり、新しいクラスのクエリインテントのサポートを追加したりする場合は、カスタム AI モードアプリを作成できます。各カスタムインテント（またはフレーム）は、エージェントがクエリをインテントに分類する条件と、エージェントがクエリを処理するために使用する手順とツールを宣言します。

engine_config.answer_agent ブロックを使用して、engines.create REST メソッドでエンジンを作成します。

構成は次のようになります。

engine {
 name: "YOUR_AI_MODE_ENGINE"
 display_name: "YOUR_AI_MODE_ENGINE_DISPLAY_NAME"
 engine_config {
   answer_agent {
     frames {
       vertical_intent: "YOUR_CUSTOM_INTENT"
       vertical_intent_prompt {
         instructions: "Instructions for when to classify a user query as YOUR_CUSTOM_INTENT."
       }
       initial_prompt {
         instructions: "Instructions for the agent on how to process a user query classified as YOUR_CUSTOM_INTENT."
         tools {
           discovery_engine_search_tool_config {
             serving_config: "YOUR_SEARCH_SERVING_CONFIG_1"
             page_size: 10
           }
           tool_description: "This tool can help search corpus 1."
         }
         tools {
           discovery_engine_search_tool_config {
             serving_config: "YOUR_SEARCH_SERVING_CONFIG_2"
             page_size: 10
           }
           tool_description: "This tool can help search corpus 2."
         }
       }
     }
   }
 }
}
engine_id: "SAMPLE_MULTI_SEARCH_RETRIEVAL"

エンジンを作成したら、その default_agent_answer サービング構成を介してリクエストをルーティングします。
```
projects/*/locations/*/collections/*/engines/YOUR_AI_MODE_ENGINE/servingConfigs/default_agent_answer
```
カスタム AI モードアプリの設計や登録についてサポートが必要な場合は、サポートにお問い合わせください。

エージェント検索を使用して回答をストリーミングする

次のコマンドは、エージェントによる検索を有効にしてストリーミング回答メソッドを呼び出す方法を示しています。エージェントによる検索なしの出力と同様に、この呼び出しは生成された回答を一連の JSON レスポンスの形式でストリーミングします。

推論エンジンを設定している場合は、そのリソース名を reasoningEngine フィールドに含めて、ターン間でセッションを永続化します。

REST

検索を行い、生成された回答をストリーミングで取得する方法を以下に示します。

次の curl コマンドを実行します。

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/SERVING_CONFIG_ID:streamAnswer" \
  -d '{
        "query": { "text": "QUERY" },
        "session": "SESSION",
        "enableAgentInvocation": true,
        "userPseudoId": "USER_PSEUDO_ID",
        "reasoningEngine": "projects/PROJECT_NUMBER/locations/LOCATION_ID/reasoningEngines/REASONING_ENGINE_ID"
      }'

次のように置き換えます。

PROJECT_ID: 実際の Google Cloud プロジェクト ID。
APP_ID: クエリする Agent Search アプリの ID。
SERVING_CONFIG_ID: カスタム AI モードアプリを使用するには、これを default_agent_answer に設定します。事前定義された Google 回答エージェントを使用するには、これを default_search に設定します。
PROJECT_NUMBER: 推論エンジンをホストするプロジェクトの番号。
QUERY: 質問または検索クエリを含むフリーテキストの文字列。
SESSION: 複数ターンの会話を継続する場合、これは前のターンのレスポンスで返されたセッションリソース名です（例: projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/sessions/SESSION_ID）。会話を継続しない場合は、ハイフン（-）に設定します。
USER_PSEUDO_ID: 訪問者のトラッキングに使用される一意の識別子。
LOCATION_ID: 推論エンジンのロケーション。例: us-central1
REASONING_ENGINE_ID: 作成した Agent Engine インスタンスの ID。

コマンドの例と部分的な結果

curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://discoveryengine.googleapis.com/v1/projects/my-project-123/locations/global/collections/default_collection/engines/my-app/servingConfigs/default_serving_config:streamAnswer" \
  -d '{
        "query": { "text": "3 bedroom house in new haven" },
        "session": "projects/123456/locations/global/collections/default_collection/engines/my-app/sessions/-",
        "enableAgentInvocation": true,
        "userPseudoId": "user-1",
        "reasoningEngine": "projects/123456/locations/us-central1/reasoningEngines/6732301450535239680"
      }'

answer  {
  name: "projects/123456/locations/global/collections/default_collection/engines/my-app/sessions/7813433670721451971/answers/7813433670721454054"
  state: SUCCEEDED
  answer_text: "I found several 3-bedroom properties in New Haven, CT, that might interest you. Here are the top three results along with their nearby schools:\n\n### 1. 37 Emerson Street, New Haven, CT\n*   **Price:** $415,061\n*   **Details:** 3 Bedrooms, 1.5 Bathrooms, 1,961 sq. ft.\n*   **Description:** An elegant multi-family residence with a two-car garage, offering classic charm and modern convenience near universities.\n*   **Nearby Schools:**\n    *   **Elementary:** Edgewood Magnet School (Rating: 3.9/5)\n    *   **Middle:** Betsy Ross Arts Magnet School (Rating: 4.1/5)\n    *   **High:** Hillhouse High School (Rating: 3.2/5)\n\n### 2. 248 West Hazel Street, New Haven, CT\n*   **Price:** $374,255\n*   **Details:** 3 Bedrooms, 2 Bathrooms, 1,835 sq. ft.\n*   **Description:** A meticulously maintained multi-family home with a two-car garage, ideal for investment or multi-generational living.\n*   **Nearby Schools:**\n    *   **Elementary:** Worthington Hooker School (Rating: 4.4/5)\n    *   **Middle:** Engineering - Science University Magnet School (Rating: 4.2/5)\n    *   **High:** Hillhouse High School (Rating: 3.2/5)\n\n### 3. 378 Central Avenue, New Haven, CT\n*   **Price:** $581,120\n*   **Details:** 3 Bedrooms, 2 Bathrooms, 1,966 sq. ft.\n*   **Description:** A distinguished three-family residence with a garage, located in a vibrant neighborhood with easy access to culinary and cultural spots.\n*   **Nearby Schools:**\n    *   **Elementary:** Edgewood Magnet School (Rating: 3.9/5)\n    *   **Middle:** Betsy Ross Arts Magnet School (Rating: 4.1/5)\n    *   **High:** Wilbur Cross High School (Rating: 3.5/5)\n\nWould you like more details on any of these listings, or would you like to schedule a tour?"
  references {
    structured_document_info {
      document: "projects/123456/locations/global/collections/default_collection/dataStores/housing-ct-20260406/branches/0/documents/34325"
      struct_data {
        fields {
          key: "address"
          value {
            string_value: "53 EMERSON STREET"
          }
        }
        fields {
          key: "bathrooms"
          value {
            number_value: 1.5
          }
        }
        fields {
          key: "bedrooms"
          value {
            number_value: 3.0
          }
        }
        fields {
          key: "garages"
          value {
            number_value: 2.0
          }
        }
        fields {
          key: "generated_description"
          value {
            string_value: "53 Emerson Street, New Haven, CT \342\200\223 An exceptional opportunity awaits in the heart of New Haven. This elegant three-family residence offers a rare blend of classic charm and modern convenience. Spanning 1,961 square feet, this property presents a versatile layout with 3 well-appointed bedrooms and 1.5 baths, catering to a variety of living arrangements or investment strategies. A coveted amenity in urban settings, a spacious two-car garage provides secure parking and additional storage. Situated in a desirable New Haven neighborhood, this address offers easy access to the city\'s vibrant cultural scene, esteemed universities, and burgeoning culinary landscape. Anticipate a 2025 valuation of $415,061. An astute investment for the discerning buyer."
          }
        }
        fields {
          key: "location"
          value {
            struct_value {
              fields {
                key: "latitude"
                value {
                  number_value: 41.32836
                }
              }
              fields {
                key: "longitude"
                value {
                  number_value: -72.96519
                }
              }
            }
          }
        }
        fields {
          key: "price"
          value {
            number_value: 415061.0
          }
        }
        fields {
          key: "residential_type"
          value {
            string_value: "Three Family"
          }
        }
        fields {
          key: "square_footage"
          value {
            number_value: 1961.0
          }
        }
        fields {
          key: "town"
          value {
            string_value: "New Haven"
          }
        }
      }
    }
    queries: "3 bedroom house in New Haven"
  }
  references {
  ...
  }
  references {
  ...
  }
  related_questions: "Schedule a tour for 248 West Hazel Street"
  related_questions: "Are there any 3 bedroom houses in New Haven under $350k?"
  related_questions: "What are the best-rated elementary schools in New Haven?"
  related_questions: "Find 4 bedroom houses in New Haven"
}
session {
  name: "projects/123456/locations/global/collections/default_collection/engines/my-app/sessions/7813433670721451971"
  state: IN_PROGRESS
  user_pseudo_id: "user-1"
  turns {
    query {
      text: "3 bedroom house in new haven"
    }
    answer: "projects/123456/locations/global/collections/default_collection/engines/my-app/sessions/7813433670721451971/answers/7813433670721454054"
  }
  start_time {
    seconds: 1778556129
    nanos: 731866398
  }
  metadata {
    key: "google.consumer_agent_session_id"
    value: "5099640345302401024"
  }
}
answer_query_token: "NMwKDAjeuYrQBhCq9aTMAhIkNmEwMzNjNjQtMDAwMC0yZjMzLWIxYzYtZjQwMzA0M2FlYmQ0"

Python

詳細については、Agent Search Python API リファレンスドキュメントをご覧ください。

Agent Search に対する認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証の設定をご覧ください。

次のサンプルでは、Discovery Engine Python クライアント（v1alpha）を使用して、エージェント呼び出しが有効になっている stream_answer_query を呼び出します。マルチターンのセッションの reasoning_engine フィールドを渡します。

from google.api_core.client_options import ClientOptions
from google.cloud import discoveryengine_v1alpha


def run_stream_answer_query():
    PROJECT_ID = "YOUR_PROJECT_ID"
    LOCATION = "global"  # or a specific region
    COLLECTION_ID = "default_collection"
    ENGINE_ID = "YOUR_ENGINE_ID"
    # Use "default_search" for the predefined Google answer agent, or
    # "default_agent_answer" if you have configured a custom AI_MODE app.
    SERVING_CONFIG_ID = "default_search"
    USER_ID = "user-id"
    QUERY_TEXT = "YOUR_QUERY_TEXT"
    REASONING_ENGINE_ID = "YOUR_REASONING_ENGINE_ID"
    # Use "-" to start a new session, or pass the sessionId returned in
    # the previous turn's response to continue an existing session.
    SESSION_ID = "-"

    SESSION_REF = (
        f"projects/{PROJECT_ID}/locations/{LOCATION}/collections/"
        f"{COLLECTION_ID}/engines/{ENGINE_ID}/sessions/{SESSION_ID}"
    )
    SERVING_CONFIG_ENGINE = (
        f"projects/{PROJECT_ID}/locations/{LOCATION}/collections/"
        f"{COLLECTION_ID}/engines/{ENGINE_ID}/servingConfigs/{SERVING_CONFIG_ID}"
    )
    REASONING_ENGINE = (
        f"projects/{PROJECT_ID}/locations/{LOCATION}/"
        f"reasoningEngines/{REASONING_ENGINE_ID}"
    )

    client_options = ClientOptions(
        api_endpoint="discoveryengine.googleapis.com"
    )

    client = discoveryengine_v1alpha.ConversationalSearchServiceClient(
        client_options=client_options
    )

    request = discoveryengine_v1alpha.AnswerQueryRequest(
        query=discoveryengine_v1alpha.Query(text=QUERY_TEXT),
        serving_config=SERVING_CONFIG_ENGINE,
        user_pseudo_id=USER_ID,
        enable_agent_invocation=True,
        session=SESSION_REF,
        reasoning_engine=REASONING_ENGINE,
    )

    print(f"Starting StreamAnswerQuery agentic session with: {request}")
    stream = client.stream_answer_query(request)

    try:
        for response in stream:
            print(f"Received response: {response}")
    except Exception as e:
        print(f"Error during streaming: {e}")


if __name__ == "__main__":
    run_stream_answer_query()

Discovery Engine SDK のプレビュー版を入手する

Discovery Engine SDK を使用すると、アプリケーションから Google Cloudサービスを簡単に操作できます。SDK は、エラー処理と認証を支援し、自動再試行、ページネーション処理、長時間実行オペレーションの管理などの機能を提供します。

エージェントによる検索機能は許可リストに登録されているため、この機能を使用するために必要な SDK は、一般提供されている Discovery Engine クライアントライブラリとは異なります。

Discovery Engine SDK のプレビュー版を取得するには、次の操作を行います。

プレビュー版 SDK の Google ドライブフォルダにアクセスするには、サポートにお問い合わせください。
言語のパッケージをダウンロードします。

API の変更点

この機能は許可リストに登録されているため、ストリーミング回答メソッドのページにある API リファレンスドキュメントには、ストリーム回答メソッドでエージェントによる検索を使用するために必要なすべてのフィールドが表示されません。欠落しているフィールドは次のように文書化されています。

リクエスト本文のフィールド

enableAgentInvocation（ブール値）- true を設定して、既存の検索サービング構成でエージェント処理に切り替えます。カスタム AI モードアプリで answer_agent サービング構成を指定する場合は、このフィールドは省略可能です。
reasoningEngine（文字列）- エージェントセッションをホストする Agent Runtime のリソース名（projects/*/locations/*/reasoningEngines/* 形式）。

レスポンスのフィールド

エージェントによる取得が有効になっている場合、生成された各 Answer.Reference には次のものが含まれます。

queries（繰り返し文字列） - エージェントがリファレンスを生成するために発行したクエリのリスト。

セッションサービス

セッションサービス REST API は、create メソッドまたは update メソッドをサポートしていません。ただし、list、get、delete などの他のメソッドはサポートしています。

セッションサービス RPC API は、マルチターンの会話に使用されるセッションリソースに対する Update オペレーションまたは Create オペレーションをサポートしていません。ただし、マルチターンの会話に使用されるセッションリソースに対する List、Get、Delete オペレーションなど、他のサービスはサポートしています。