Grounding dengan Penelusuran web paralel

Parallel Web Systems menawarkan API penelusuran yang menyediakan akses ke data web yang tersedia secara publik yang dioptimalkan untuk digunakan oleh model bahasa besar (LLM) untuk proses perujukan. Halaman ini menjelaskan cara mendasari respons Gemini dengan menggunakan Paralel.

Pengaitan dengan Parallel di Gemini Enterprise Agent Platform adalah Penawaran Terpisah (sebagaimana didefinisikan dalam Perjanjian Anda) yang menghubungkan model Gemini ke data web publik yang disediakan oleh Parallel Web Systems' search API. Layanan ini memberi Gemini akses ke informasi live dari miliaran halaman web untuk memastikan respons yang lebih terbaru dan faktual. Google Cloud

Perhatikan hal berikut: Penggunaan Parallel oleh Anda mengharuskan Google Cloud mengirimkan Data Pelanggan tertentu ke Penawaran Terpisah Parallel untuk diproses. Penggunaan layanan Parallel oleh Anda diatur oleh persyaratan penggunaan terpisah Parallel dan kebijakan penggunaan yang dapat diterima dari Parallel.

Kasus penggunaan

Perujukan dengan Paralel cocok untuk kasus penggunaan seperti berikut:

  • Menggunakan data web untuk tujuan pelengkapan atau pengayaan informasi.
  • Agen multi-hop yang memerlukan penelusuran web yang lebih mendalam untuk pertanyaan yang lebih kompleks.
  • Membangun API yang mengintegrasikan data penelusuran web.
  • Asisten yang berinteraksi dengan karyawan yang memungkinkan pengguna akhir mengajukan pertanyaan dan membuat laporan kompleks menggunakan informasi web terbaru.
  • Aplikasi yang ditujukan untuk konsumen, seperti retail dan perjalanan, yang memungkinkan pengguna membuat keputusan pembelian yang tepat.
  • Agen otomatis yang berjalan secara mandiri untuk melakukan tugas otomatis, seperti analisis berita dan pemeriksaan KYC.
  • Agen vertikal (agen penjualan, agen coding, agen keuangan) mendapatkan konteks terbaru dari web.

Contoh

Siapa yang memenangkan F1 Grand Prix Las Vegas 2025?

Tanpa Perujukan (Without Grounding) Dengan Grounding
Grand Prix Las Vegas 2025 belum berlangsung. Balapan dijadwalkan berlangsung pada akhir pekan 20-22 November 2025. Oleh karena itu, pemenangnya tidak diketahui. Pemenang F1 Grand Prix Las Vegas 2025 adalah Max Verstappen dari Red Bull Racing. Balapan ini berlangsung pada 22 November 2025. Sumber: domain1.com, domain2.com, ...

Model yang didukung

Perujukan dengan Penelusuran web paralel didukung oleh model berikut:

  • Gemini 2.5 Flash (gemini-2.5-flash)
  • Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
  • Gemini 2.5 Pro (gemini-2.5-pro)
  • Gemini 3.1 Pro (gemini-3.1-pro-preview)
  • Gemini 3 Flash Lite (gemini-3-flash-lite-preview)

Sebelum memulai

Untuk menggunakan Perujukan dengan Paralel, Anda harus mendapatkan kunci API dari situs web Paralel. Kunci API ini digunakan dalam permintaan Anda ke Gemini.

Mendasari respons Gemini dengan Parallel

Minta respons yang memiliki rujukan dari Gemini menggunakan REST API sebagai berikut. Untuk performa terbaik, sebaiknya gunakan setelan default untuk parameter opsional, kecuali jika Anda benar-benar memerlukan nilai non-default.

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • LOCATION: Region untuk memproses permintaan. Untuk menggunakan endpoint global, kecualikan lokasi dari nama endpoint dan konfigurasi lokasi resource ke `global`.
  • PROJECT_ID: Project ID Google Cloud Anda.
  • MODEL_ID: ID model yang akan digunakan.
  • TEXT: Perintah teks yang akan dikirim ke model.
  • API_KEY: Kunci API Anda untuk Penelusuran AI Paralel.
  • EXCLUDE_DOMAINS: Opsional: Daftar domain yang akan dikecualikan dari sumber perujukan. Jika ditentukan, sumber dari domain ini akan dikecualikan. Nilai yang dapat diterima adalah domain (www.example.com) atau ekstensi domain yang diawali dengan titik (.gov, .edu, .co.uk). Anda dapat menentukan hingga 10 domain.
  • INCLUDE_DOMAINS: Opsional: Daftar domain yang akan disertakan dalam sumber perujukan. Jika ditentukan, sumber dari domain ini akan disertakan. Nilai yang dapat diterima adalah domain (www.example.com) atau ekstensi domain yang diawali dengan titik ( .gov, .edu, .co.uk). Anda dapat menentukan hingga 10 domain.
  • MAX_CHARS_PER_RESULT: Opsional: Jumlah maksimum karakter yang akan disertakan dalam setiap kutipan hasil penelusuran. Jika tidak ditentukan, setelan defaultnya adalah 30000. Rentang yang diizinkan adalah [1000, 100000].
  • MAX_CHARS_TOTAL: Opsional: Jumlah total maksimum karakter dari semua kutipan hasil penelusuran. Jika tidak ditentukan, nilai defaultnya adalah 100000. Rentang yang diizinkan adalah [1000, 1000000].
  • MAX_RESULTS: Opsional: Jumlah maksimum hasil penelusuran yang akan digunakan untuk perujukan. Jika tidak ditentukan, nilai defaultnya adalah 10. Rentang yang diizinkan adalah [1, 20].
  • MODE: Opsional: Mode yang akan digunakan untuk permintaan, baik one-shot maupun fast. Defaultnya adalah one-shot. Pertimbangkan mode fast jika Anda ingin mengoptimalkan latensi.

Metode HTTP dan URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Meminta isi JSON:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS,
            "mode": "MODE"
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:

Anda akan melihat respons JSON yang mirip seperti berikut:

Kuota

Kuota default adalah 200 perintah per menit. Jika Anda perlu meningkatkan batas frekuensi, hubungi support@parallel.ai dan tim akun Google Anda dengan kasus penggunaan dan persyaratan Anda.

Penagihan

Penggunaan Grounding dengan Paralel akan dikenai biaya berikut:

  • Penggunaan token Gemini: Token perintah, token penalaran, token output. Untuk mengetahui informasi selengkapnya, lihat Harga.
  • Perujukan Gemini dengan data Anda: Untuk mengetahui informasi selengkapnya, lihat Harga.
    • Token input yang disediakan oleh Parallel tidak dikenai biaya tambahan.
  • Harga untuk penggunaan API penelusuran Parallel: Untuk mengetahui informasi selengkapnya, lihat halaman harga Parallel.