Grounding dengan Penelusuran web paralel

Parallel Web Systems menawarkan API penelusuran yang menyediakan akses ke data web yang tersedia secara publik dan dioptimalkan untuk digunakan oleh model bahasa besar (LLM) untuk proses perujukan. Halaman ini menjelaskan cara mendasari respons Gemini dengan menggunakan Paralel.

Grounding dengan Parallel di Vertex AI adalah Penawaran Terpisah (sebagaimana ditentukan dalam Perjanjian Anda) yang menghubungkan model Gemini ke data web publik yang disediakan oleh API penelusuran Parallel Web Systems. Google Cloud Layanan ini memberi Gemini akses ke informasi langsung dari miliaran halaman web untuk memastikan respons yang lebih terbaru dan faktual.

Perhatikan hal berikut: Penggunaan Parallel memerlukan Google Cloud untuk mengirimkan Data Pelanggan tertentu ke Parallel Separate Offering untuk diproses. Penggunaan Anda atas layanan Parallel diatur oleh persyaratan penggunaan terpisah Parallel dan kebijakan penggunaan yang dapat diterima Parallel.

Kasus penggunaan

Perujukan dengan Paralel cocok untuk kasus penggunaan seperti berikut:

  • Menggunakan data web untuk tujuan pelengkapan atau pengayaan informasi.
  • Agen multi-hop yang memerlukan penelusuran web yang lebih mendalam untuk pertanyaan yang lebih kompleks.
  • Membangun API yang mengintegrasikan data penelusuran web.
  • Asisten yang berinteraksi dengan karyawan yang memungkinkan pengguna akhir mengajukan pertanyaan dan membuat laporan kompleks menggunakan informasi web terbaru.
  • Aplikasi yang ditujukan untuk konsumen, seperti retail dan perjalanan, yang memungkinkan pengguna membuat keputusan pembelian yang tepat.
  • Agen otomatis yang berjalan secara mandiri untuk melakukan tugas otomatis, seperti analisis berita dan pemeriksaan KYC.
  • Agen vertikal (agen penjualan, agen coding, agen keuangan) mendapatkan konteks terbaru dari web.

Contoh

Siapa yang memenangkan F1 Grand Prix Las Vegas 2025?

Tanpa Perujukan (Without Grounding) Dengan Grounding
Grand Prix Las Vegas 2025 belum berlangsung. Balapan dijadwalkan berlangsung pada akhir pekan 20-22 November 2025. Oleh karena itu, pemenangnya saat ini tidak diketahui. Pemenang F1 Grand Prix Las Vegas 2025 adalah Max Verstappen dari Red Bull Racing. Balapan ini berlangsung pada 22 November 2025. Sumber: domain1.com, domain2.com, ...

Model yang didukung

Bagian ini mencantumkan model yang mendukung Perujukan dengan Penelusuran web paralel.

Sebelum memulai

Untuk menggunakan Perujukan dengan Paralel, Anda harus mendapatkan kunci API dari situs web Paralel. Kunci API ini digunakan dalam permintaan Anda ke Gemini.

Menyertakan informasi dari Parallel dalam respons Gemini

Minta respons yang memiliki rujukan dari Gemini menggunakan REST API sebagai berikut. Untuk performa terbaik, sebaiknya gunakan setelan default untuk parameter opsional, kecuali jika Anda benar-benar memerlukan nilai non-default.

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • LOCATION: Region untuk memproses permintaan. Untuk menggunakan endpoint global, kecualikan lokasi dari nama endpoint dan konfigurasi lokasi resource ke `global`.
  • PROJECT_ID: Project ID Google Cloud Anda.
  • MODEL_ID: ID model yang akan digunakan.
  • TEXT: Perintah teks yang akan dikirim ke model.
  • API_KEY: Kunci API Anda untuk Parallel AI Search.
  • EXCLUDE_DOMAINS: Opsional: Daftar domain yang akan dikecualikan dari sumber perujukan. Jika ditentukan, sumber dari domain ini akan dikecualikan. Nilai yang dapat diterima adalah domain (www.example.com) atau ekstensi domain yang diawali dengan titik ( .gov, .edu, .co.uk). Anda dapat menentukan hingga 10 domain.
  • INCLUDE_DOMAINS: Opsional: Daftar domain yang akan disertakan dalam sumber perujukan. Jika ditentukan, sumber dari domain ini akan disertakan. Nilai yang dapat diterima adalah domain (www.example.com) atau ekstensi domain yang diawali dengan titik ( .gov, .edu, .co.uk). Anda dapat menentukan hingga 10 domain.
  • MAX_CHARS_PER_RESULT: Opsional: Jumlah maksimum karakter yang akan disertakan dalam setiap kutipan hasil penelusuran. Jika tidak ditentukan, setelan defaultnya adalah 30000. Rentang yang diizinkan adalah [1000, 100000].
  • MAX_CHARS_TOTAL: Opsional: Jumlah total maksimum karakter dari semua kutipan hasil penelusuran. Jika tidak ditentukan, nilai defaultnya adalah 100000. Rentang yang diizinkan adalah [1000, 1000000].
  • MAX_RESULTS: Opsional: Jumlah maksimum hasil penelusuran yang akan digunakan untuk perujukan. Jika tidak ditentukan, nilai defaultnya adalah 10. Rentang yang diizinkan adalah [1, 20].

Metode HTTP dan URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

Meminta isi JSON:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "parallelAiSearch": {
        "api_key": "API_KEY",
        "customConfigs": {
            "source_policy": {
                "exclude_domains": ["EXCLUDE_DOMAINS"],
                "include_domains": ["INCLUDE_DOMAINS"],
            },
            "excerpts": {
                "max_chars_per_result": MAX_CHARS_PER_RESULT,
                "max_chars_total": MAX_CHARS_TOTAL
            },
            "max_results": MAX_RESULTS
        }
    }
}],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:

Anda akan melihat respons JSON yang mirip seperti berikut:

Kuota

Kuota defaultnya adalah 60 perintah per menit. Jika Anda perlu meningkatkan batas kecepatan, hubungi support@parallel.ai dan tim akun Google Anda dengan kasus penggunaan dan persyaratan Anda.

Penagihan

Penggunaan Grounding dengan Paralel akan dikenai biaya berikut:

  • Penggunaan token Gemini: Token perintah, token penalaran, token output. Untuk mengetahui informasi selengkapnya, lihat Harga.
  • Perujukan Gemini dengan data Anda: Untuk mengetahui informasi selengkapnya, lihat Harga.
    • Token input yang disediakan oleh Parallel tidak dikenai biaya tambahan.
  • Harga untuk penggunaan API penelusuran Parallel: Untuk mengetahui informasi selengkapnya, lihat halaman harga Parallel.