Parallel Web Systems は、グラウンディング用の大規模言語モデルで使用するために最適化された一般公開のウェブデータにアクセスできる検索 API を提供しています。このページでは、Parallel を使用して Gemini レスポンスをグラウンディングする方法について説明します。
Vertex AI の Parallel によるグラウンディングは、Parallel Web Systems の検索 API が提供する公開ウェブデータに Gemini モデルを接続する別のサービス( Google Cloud 契約で定義)です。このサービスにより、Gemini は数十億ものウェブページからリアルタイムの情報にアクセスし、より最新で事実に基づいた回答を生成できます。
次の点にご注意ください: Parallel を使用するには、Google Cloud が特定の顧客データを Parallel の個別サービスに送信して処理する必要があります。Parallel サービスの使用には、Parallel の個別の利用規約と Parallel の利用規定が適用されます。
ユースケース
Parallel を使用したグラウンディングは、次のようなユースケースに適しています。
- ウェブデータを情報の補完や拡充を目的として使用する。
- より複雑な質問に対して、より詳細なウェブ検索が必要なマルチホップ エージェント。
- ウェブ検索データを統合する API の構築。
- エンドユーザーが質問したり、最新のウェブ情報を使用して複雑なレポートを作成したりできる従業員向けのアシスタント。
- ユーザーが十分な情報に基づいて購入を決定できる、小売や旅行などの消費者向けアプリケーション。
- ニュース分析や KYC チェックなどの自動タスクを実行するために自律的に動作する自動エージェント。
- ウェブから最新のコンテキストを取得する垂直エージェント(営業担当者、コーディング エージェント、財務エージェント)。
例
2025 年のラスベガス F1 グランプリの優勝者は誰ですか?
| グラウンディングなし | グラウンディングを使用する場合 |
|---|---|
| 2025 年のラスベガス グランプリはまだ開催されていません。レースは 2025 年 11 月 20 ~ 22 日の週末に開催される予定です。そのため、現時点では勝者は不明です。 | 2025 年のラスベガス F1 グランプリの優勝者は、レッドブル レーシングのマックス フェルスタッペンでした。レースは 2025 年 11 月 22 日に開催されました。 ソース: domain1.com、domain2.com、... |
サポートされているモデル
このセクションでは、並列ウェブ検索によるグラウンディングをサポートするモデルを示します。
- Gemini 3 Flash プレビュー モデル
- Gemini 3 Pro プレビュー モデル
- Gemini 3 Pro Image プレビュー モデル
- Gemini 2.5 Pro
- Gemini 2.5 Flash プレビュー モデル
- Gemini 2.5 Flash-Lite プレビュー モデル
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini Live API ネイティブ音声を使用した Gemini 2.5 Flash
- Live API ネイティブ音声を使用した Gemini 2.5 Flash(プレビュー) プレビュー モデル
- Live API を使用した Gemini 2.0 Flash プレビュー モデル
- Gemini 2.0 Flash
始める前に
Parallel でグラウンディングを使用するには、Parallel のウェブサイトから API キーを取得する必要があります。この API キーは、Gemini へのリクエストで使用されます。
Parallel を使用して Gemini の回答をグラウンディングする
REST API を使用して、Gemini からグラウンディングされた回答をリクエストします。最適なパフォーマンスを得るには、デフォルト以外の値を厳密に必要とする場合を除き、省略可能なパラメータのデフォルト設定を使用することをおすすめします。
REST
リクエストのデータを使用する前に、次のように置き換えます。
- LOCATION: リクエストを処理するリージョン。グローバル エンドポイントを使用するには、エンドポイント名からロケーションを除外し、リソースのロケーションを `global` に構成します。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- MODEL_ID: 使用するモデルの ID。
- TEXT: モデルに送信するテキスト プロンプト。
- API_KEY: Parallel AI Search の API キー。
- EXCLUDE_DOMAINS: 省略可。グラウンディング ソースから除外するドメインのリスト。指定すると、これらのドメインのソースが除外されます。指定できる値は、ドメイン(www.example.com)またはピリオドで始まるドメイン拡張子(.gov、.edu、.co.uk)です。最大 10 個のドメインを指定できます。
- INCLUDE_DOMAINS: 省略可。グラウンディング ソースに含めるドメインのリスト。指定した場合、これらのドメインのソースが含まれます。指定できる値は、ドメイン(www.example.com)またはピリオドで始まるドメイン拡張子(.gov、.edu、.co.uk)です。最大 10 個のドメインを指定できます。
- MAX_CHARS_PER_RESULT: 省略可。各検索結果の抜粋に含める最大文字数。指定しない場合、デフォルトで
30000になります。有効な範囲は[1000, 100000]です。 - MAX_CHARS_TOTAL: 省略可。すべての検索結果の抜粋の合計文字数の最大値。指定しない場合、デフォルトで
100000になります。有効な範囲は[1000, 1000000]です。 - MAX_RESULTS: 省略可。グラウンディングに使用する検索結果の最大数。指定しない場合、デフォルトで
10になります。指定できる範囲は[1, 20]です。
HTTP メソッドと URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
リクエストの本文(JSON):
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
リクエストを送信するには、次のいずれかのオプションを展開します。
次のような JSON レスポンスが返されます。
割り当て
デフォルトの割り当ては、1 分あたり 60 個のプロンプトです。レート上限を引き上げる必要がある場合は、ユースケースと要件を添えて support@parallel.ai と Google アカウント チームにお問い合わせください。
課金
Parallel でグラウンディングを使用すると、次の料金が発生します。
- Gemini のトークン使用量: プロンプト トークン、思考トークン、出力トークン。詳細は、料金をご覧ください。
- Gemini のデータによるグラウンディング: 詳細については、料金をご覧ください。
- Parallel が提供する入力トークンに追加料金はかかりません。
- Parallel の検索 API の使用料金: 詳しくは、Parallel の料金ページをご覧ください。