Grounding dengan Penelusuran web paralel

Parallel Web Systems menawarkan API penelusuran yang menyediakan akses ke data web yang tersedia secara publik dan dioptimalkan untuk digunakan oleh model bahasa yang besar untuk perujukan (grounding). Halaman ini menjelaskan cara merujuk (grounding) respons Gemini menggunakan Parallel.

Perujukan (grounding) dengan Parallel di Platform Agen Gemini Enterprise adalah Penawaran Terpisah (seperti yang ditentukan dalam your Google Cloud Agreement) yang menghubungkan model Gemini ke data web publik yang disediakan oleh API penelusuran Parallel Web Systems'. Layanan ini memberi Gemini akses ke informasi langsung dari miliaran halaman web untuk memastikan respons yang lebih baru dan faktual.

Perhatikan hal berikut: Penggunaan Parallel memerlukan Google Cloud untuk mengirim Data Pelanggan tertentu ke Parallel Penawaran Terpisah untuk diproses. Penggunaan layanan Parallel Anda diatur oleh persyaratan penggunaan terpisah Parallel dan kebijakan penggunaan yang dapat diterima Parallel.

Kasus penggunaan

Perujukan (grounding) dengan Parallel cocok untuk kasus penggunaan seperti berikut:

  • Menggunakan data web untuk tujuan penyelesaian atau pengayaan informasi.
  • Agen multi-hop yang memerlukan penelusuran web lebih mendalam untuk pertanyaan yang lebih kompleks.
  • Membuat API yang mengintegrasikan data penelusuran web.
  • Asisten yang berinteraksi dengan karyawan yang memungkinkan pengguna akhir mengajukan pertanyaan dan membuat laporan kompleks menggunakan informasi web terbaru.
  • Aplikasi yang berinteraksi dengan konsumen, seperti retail dan perjalanan, yang memungkinkan pengguna membuat keputusan pembelian yang tepat.
  • Agen otomatis yang berjalan secara mandiri untuk melakukan tugas otomatis, seperti analisis berita dan pemeriksaan KYC.
  • Agen vertikal (agen penjualan, agen coding, agen keuangan) yang mendapatkan konteks terbaru dari web.

Contoh

Siapa yang memenangkan F1 Grand Prix Las Vegas 2025?

Tanpa Perujukan (Grounding) Dengan Perujukan (Grounding)
Grand Prix Las Vegas 2025 belum terjadi. Balapan dijadwalkan akan berlangsung pada akhir pekan 20-22 November 2025. Oleh karena itu, pemenangnya tidak diketahui. Pemenang F1 Grand Prix Las Vegas 2025 adalah Max Verstappen dari Red Bull Racing. Balapan berlangsung pada 22 November 2025. Sumber: domain1.com, domain2.com, ...

Model yang didukung

Perujukan (grounding) dengan penelusuran web Parallel didukung oleh model berikut:

  • Gemini 2.5 Flash (gemini-2.5-flash)
  • Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
  • Gemini 2.5 Pro (gemini-2.5-pro)
  • Gemini 3.1 Pro (gemini-3.1-pro-preview)
  • Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

Sebelum memulai

Untuk menggunakan Perujukan (grounding) dengan Parallel, Anda harus mendapatkan kunci API dari situs Parallel. Kunci API ini digunakan dalam permintaan Anda ke Gemini.

Merujuk (grounding) respons Gemini dengan Parallel

Minta respons yang dirujuk (grounding) dari Gemini menggunakan REST API sebagai berikut. Untuk performa terbaik, sebaiknya gunakan setelan default untuk parameter opsional kecuali jika Anda benar-benar memerlukan nilai non-default.

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • LOCATION: Region untuk memproses permintaan. Untuk menggunakan endpoint global, kecualikan lokasi dari nama endpoint dan konfigurasi lokasi resource ke `global`.
  • PROJECT_ID: Project ID Anda Google Cloud .
  • MODEL_ID: ID model yang akan digunakan.
  • TEXT: Perintah teks yang akan dikirim ke model.
  • API_KEY: Kunci API Anda untuk Parallel AI Search.
  • EXCLUDE_DOMAINS: Opsional: Daftar domain yang akan dikecualikan dari sumber perujukan (grounding). Jika ditentukan, sumber dari domain ini akan dikecualikan. Nilai yang dapat diterima adalah domain (www.example.com) atau ekstensi domain yang dimulai dengan titik ( .gov, .edu, .co.uk). Anda dapat menentukan hingga 10 domain.
  • INCLUDE_DOMAINS: Opsional: Daftar domain yang akan disertakan dalam sumber perujukan (grounding). Jika ditentukan, sumber dari domain ini akan disertakan. Nilai yang dapat diterima adalah domain (www.example.com) atau ekstensi domain yang dimulai dengan titik ( .gov, .edu, .co.uk). Anda dapat menentukan hingga 10 domain.
  • MAX_CHARS_PER_RESULT: Opsional: Jumlah maksimum karakter yang akan disertakan dalam setiap kutipan hasil penelusuran. Jika tidak ditentukan, ditetapkan secara default ke 30000. Rentang yang diizinkan adalah [1000, 100000].
  • MAX_CHARS_TOTAL: Opsional: Jumlah total karakter maksimum dari semua kutipan hasil penelusuran. Jika tidak ditentukan, ditetapkan secara default ke 100000. Rentang yang diizinkan adalah [1000, 1000000].
  • MAX_RESULTS: Opsional: Jumlah maksimum hasil penelusuran yang akan digunakan untuk perujukan (grounding). Jika tidak ditentukan, ditetapkan secara default ke 10. Rentang yang diizinkan adalah [1, 20].
  • MODE: Opsional: Mode yang akan digunakan untuk permintaan, baik one-shot atau fast. Defaultnya adalah one-shot. Pertimbangkan mode fast jika Anda ingin mengoptimalkan latensi.

Metode HTTP dan URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Meminta isi JSON:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS,
            "mode": "MODE"
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:

Anda akan melihat respons JSON yang mirip seperti berikut:

Quota

Kuota default adalah 200 perintah per menit. Jika Anda perlu meningkatkan batas frekuensi, hubungi support@parallel.ai dan tim akun Google Anda dengan kasus penggunaan dan persyaratan Anda.

Penagihan

Penggunaan Perujukan (grounding) dengan Parallel akan dikenai biaya berikut:

  • Penggunaan token Gemini: Token perintah, token penalaran, token output. Untuk informasi selengkapnya, lihat Harga.
  • Perujukan (grounding) Gemini dengan data Anda: Untuk informasi selengkapnya, lihat Harga.
    • Token input yang disediakan oleh Parallel tidak dikenai biaya tambahan.
  • Harga untuk penggunaan API penelusuran Parallel: Untuk informasi selengkapnya, lihat halaman harga Parallel.