Parallel Web Systems menawarkan API penelusuran yang menyediakan akses ke data web yang tersedia secara publik dan dioptimalkan untuk digunakan oleh model bahasa besar (LLM) untuk proses perujukan. Halaman ini menjelaskan cara mendasari respons Gemini dengan menggunakan Paralel.
Grounding dengan Parallel di Vertex AI adalah Penawaran Terpisah (sebagaimana ditentukan dalam Perjanjian Anda) yang menghubungkan model Gemini ke data web publik yang disediakan oleh API penelusuran Parallel Web Systems. Google Cloud Layanan ini memberi Gemini akses ke informasi langsung dari miliaran halaman web untuk memastikan respons yang lebih terbaru dan faktual.
Perhatikan hal berikut: Penggunaan Parallel memerlukan Google Cloud untuk mengirimkan Data Pelanggan tertentu ke Parallel Separate Offering untuk diproses. Penggunaan Anda atas layanan Parallel diatur oleh persyaratan penggunaan terpisah Parallel dan kebijakan penggunaan yang dapat diterima Parallel.
Kasus penggunaan
Perujukan dengan Paralel cocok untuk kasus penggunaan seperti berikut:
- Menggunakan data web untuk tujuan pelengkapan atau pengayaan informasi.
- Agen multi-hop yang memerlukan penelusuran web yang lebih mendalam untuk pertanyaan yang lebih kompleks.
- Membangun API yang mengintegrasikan data penelusuran web.
- Asisten yang berinteraksi dengan karyawan yang memungkinkan pengguna akhir mengajukan pertanyaan dan membuat laporan kompleks menggunakan informasi web terbaru.
- Aplikasi yang ditujukan untuk konsumen, seperti retail dan perjalanan, yang memungkinkan pengguna membuat keputusan pembelian yang tepat.
- Agen otomatis yang berjalan secara mandiri untuk melakukan tugas otomatis, seperti analisis berita dan pemeriksaan KYC.
- Agen vertikal (agen penjualan, agen coding, agen keuangan) mendapatkan konteks terbaru dari web.
Contoh
Siapa yang memenangkan F1 Grand Prix Las Vegas 2025?
| Tanpa Perujukan (Without Grounding) | Dengan Grounding |
|---|---|
| Grand Prix Las Vegas 2025 belum berlangsung. Balapan dijadwalkan berlangsung pada akhir pekan 20-22 November 2025. Oleh karena itu, pemenangnya saat ini tidak diketahui. | Pemenang F1 Grand Prix Las Vegas 2025 adalah Max Verstappen dari Red Bull Racing. Balapan ini berlangsung pada 22 November 2025. Sumber: domain1.com, domain2.com, ... |
Model yang didukung
Bagian ini mencantumkan model yang mendukung Perujukan dengan Penelusuran web paralel.
- Gemini 3 Flash Model pratinjau
- Gemini 3 Pro Model pratinjau
- Gambar Gemini 3 Pro Model pratinjau
- Gemini 2.5 Pro
- Gemini 2.5 Flash Model pratinjau
- Gemini 2.5 Flash-Lite Model pratinjau
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Flash dengan audio bawaan Gemini Live API
- Gemini 2.5 Flash dengan audio native Live API (Pratinjau) Model pratinjau
- Gemini 2.0 Flash dengan Live API Preview model
- Gemini 2.0 Flash
Sebelum memulai
Untuk menggunakan Perujukan dengan Paralel, Anda harus mendapatkan kunci API dari situs web Paralel. Kunci API ini digunakan dalam permintaan Anda ke Gemini.
Menyertakan informasi dari Parallel dalam respons Gemini
Minta respons yang memiliki rujukan dari Gemini menggunakan REST API sebagai berikut. Untuk performa terbaik, sebaiknya gunakan setelan default untuk parameter opsional, kecuali jika Anda benar-benar memerlukan nilai non-default.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- LOCATION: Region untuk memproses permintaan. Untuk menggunakan endpoint global, kecualikan lokasi dari nama endpoint dan konfigurasi lokasi resource ke `global`.
- PROJECT_ID: Project ID Google Cloud Anda.
- MODEL_ID: ID model yang akan digunakan.
- TEXT: Perintah teks yang akan dikirim ke model.
- API_KEY: Kunci API Anda untuk Parallel AI Search.
- EXCLUDE_DOMAINS: Opsional: Daftar domain yang akan dikecualikan dari sumber perujukan. Jika ditentukan, sumber dari domain ini akan dikecualikan. Nilai yang dapat diterima adalah domain (www.example.com) atau ekstensi domain yang diawali dengan titik ( .gov, .edu, .co.uk). Anda dapat menentukan hingga 10 domain.
- INCLUDE_DOMAINS: Opsional: Daftar domain yang akan disertakan dalam sumber perujukan. Jika ditentukan, sumber dari domain ini akan disertakan. Nilai yang dapat diterima adalah domain (www.example.com) atau ekstensi domain yang diawali dengan titik ( .gov, .edu, .co.uk). Anda dapat menentukan hingga 10 domain.
- MAX_CHARS_PER_RESULT: Opsional: Jumlah
maksimum karakter yang akan disertakan dalam setiap kutipan hasil penelusuran. Jika tidak ditentukan, setelan defaultnya adalah
30000. Rentang yang diizinkan adalah[1000, 100000]. - MAX_CHARS_TOTAL: Opsional: Jumlah total maksimum
karakter dari semua kutipan hasil penelusuran. Jika tidak ditentukan, nilai defaultnya adalah
100000. Rentang yang diizinkan adalah[1000, 1000000]. - MAX_RESULTS: Opsional: Jumlah maksimum hasil
penelusuran yang akan digunakan untuk perujukan. Jika tidak ditentukan, nilai defaultnya adalah
10. Rentang yang diizinkan adalah[1, 20].
Metode HTTP dan URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
Meminta isi JSON:
{
"contents": [{
"role": "user",
"parts": [{
"text": "TEXT"
}]
}],
"tools": [{
"parallelAiSearch": {
"api_key": "API_KEY",
"customConfigs": {
"source_policy": {
"exclude_domains": ["EXCLUDE_DOMAINS"],
"include_domains": ["INCLUDE_DOMAINS"],
},
"excerpts": {
"max_chars_per_result": MAX_CHARS_PER_RESULT,
"max_chars_total": MAX_CHARS_TOTAL
},
"max_results": MAX_RESULTS
}
}
}],
"model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan melihat respons JSON yang mirip seperti berikut:
Kuota
Kuota defaultnya adalah 60 perintah per menit. Jika Anda perlu meningkatkan batas kecepatan, hubungi support@parallel.ai dan tim akun Google Anda dengan kasus penggunaan dan persyaratan Anda.
Penagihan
Penggunaan Grounding dengan Paralel akan dikenai biaya berikut:
- Penggunaan token Gemini: Token perintah, token penalaran, token output. Untuk mengetahui informasi selengkapnya, lihat Harga.
- Perujukan Gemini dengan data Anda: Untuk mengetahui informasi selengkapnya, lihat Harga.
- Token input yang disediakan oleh Parallel tidak dikenai biaya tambahan.
- Harga untuk penggunaan API penelusuran Parallel: Untuk mengetahui informasi selengkapnya, lihat halaman harga Parallel.