Menggunakan Agen Deep Research Gemini

Agen Deep Research Gemini adalah agen AI terkelola yang dirancang untuk merencanakan, mengeksekusi, dan menyintesis alur kerja riset multi-langkah yang kompleks. Didukung oleh Gemini, agen ini menjelajahi berbagai lanskap informasi, termasuk web publik dan data perusahaan pribadi untuk membuat laporan komprehensif yang dikutip dan mempercepat pengambilan keputusan yang tepat.

Halaman ini membahas cara menggunakan Agen Riset Mendalam Gemini, termasuk kemampuan dan batasan utamanya, cara memulai tugas riset, serta cara menangani waktu tunggu dan penanganan error.

Kapan menggunakan Deep Research

Deep Research adalah agen, bukan hanya model. Cara ini paling cocok untuk workload yang memungkinkan pendekatan analisis asinkron, bukan chat latensi rendah.

Pertimbangkan keunggulan Deep Research berikut saat Anda merencanakan project Anda:

  • Proses berulang: Alih-alih membuat respons instan seperti model chat standar, Riset Mendalam mengikuti alur kerja multi-langkah yang metodis: Rencanakan > Penelusuran multi-sumber > Ulangi > Output.

  • Beban kerja tingkat lanjut: Deep Research secara khusus dirancang untuk menangani tugas kompleks seperti uji tuntas, analisis pasar, dan lanskap persaingan.

  • Perujukan data yang ekstensif: Agen Deep Research Gemini dapat melakukan penalaran di berbagai sumber data secara bersamaan. Hal ini mencakup server MCP jarak jauh, pengetahuan institusional internal, dan konteks langsung dari file atau folder yang diupload.

  • Pelaporan yang lebih baik: Menghasilkan laporan komprehensif yang mencantumkan kutipan dan dapat menampilkan visual yang siap digunakan dalam presentasi. Hal ini mencakup grafik keuangan, infografik inline, dan matriks posisi pasar, yang dibuat menggunakan HTML dan model gambar.

  • Kemampuan pengarahan yang tinggi: Anda dapat menyesuaikan output akhir secara langsung dalam perintah Anda. Hal ini mencakup menetapkan gaya bahasa tertentu (misalnya, teknis atau eksekutif), menentukan format yang ketat, atau meminta tabel data terstruktur.

Tabel berikut membandingkan Agen Riset Mendalam Gemini dengan model Gemini standar di berbagai metrik, termasuk latensi, output, dan kegunaan masing-masing model:

Fitur Model Gemini standar Agen Deep Research Gemini
Latensi Detik Menit
Proses Buat → Output Rencanakan → Penelusuran multi-sumber → Ulangi → Output
Output Teks dan kode gaya percakapan Laporan yang mendetail dan dikutip dengan diagram dan gambar inline
Paling cocok untuk Chatbot, ekstraksi informasi, peringkasan Analisis pasar, riset mendalam, lanskap persaingan

Kemampuan utama

Deep Research dilengkapi dengan fitur dan kemampuan berikut:

  • Perujukan pada beberapa sumber, termasuk:
  • Output gambar dan diagram: Buat laporan mendetail yang berisi aset siap presentasi seperti infografik inline, diagram matriks posisi pasar, dan grafik performa keuangan
  • Kutipan inline

Cara menggunakan Deep Research

Anda dapat mengakses Agen Riset Mendalam Gemini menggunakan endpoint global (v1beta1) dengan menggunakan Google Gen AI SDK atau permintaan REST API langsung. Untuk contoh penggunaan, lihat Introduction to Gemini Deep Research Pro notebook on GitHub.

Sebelum memulai

  1. Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Agent Platform API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. Make sure that you have the following role or roles on the project: roles/aiplatform.user, roles/serviceusage.serviceUsageConsumer

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. Click Grant access.
    4. In the New principals field, enter your user identifier. This is typically the email address for a Google Account.

    5. Click Select a role, then search for the role.
    6. To grant additional roles, click Add another role and add each additional role.
    7. Click Save.
  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. Verify that billing is enabled for your Google Cloud project.

  8. Enable the Agent Platform API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  9. Make sure that you have the following role or roles on the project: roles/aiplatform.user, roles/serviceusage.serviceUsageConsumer

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. Click Grant access.
    4. In the New principals field, enter your user identifier. This is typically the email address for a Google Account.

    5. Click Select a role, then search for the role.
    6. To grant additional roles, click Add another role and add each additional role.
    7. Click Save.

Memulai tugas Deep Research

Tugas riset melibatkan penelusuran dan pembacaan secara iteratif, dan dapat memerlukan waktu beberapa menit untuk diselesaikan. Anda harus menjalankan Agen Deep Research Gemini secara asinkron.

Anda harus menggunakan eksekusi latar belakang dan mode streaming. Untuk melakukannya, tetapkan kolom background dan stream ke True dalam konfigurasi respons saat Anda menjalankan agen. API segera menampilkan objek Interaction parsial. Anda dapat menggunakan properti id untuk mengambil interaksi untuk polling. Status interaksi akan bertransisi dari in_progress ke completed atau failed.

Python


import time
from google import genai

client = genai.Client(enterprise=True, project="PROJECT_ID", location="global")

interaction = client.interactions.create(
  input="Analyze competitive positioning for solar energy providers.",
  agent="deep-research-preview-04-2026",
  background=True,
  stream=True
)

print(f"Research started: {interaction.id}")

while True:
  interaction = client.interactions.get(interaction.id)
  if interaction.status == "completed":
    print(interaction.steps[-1].content[0].text)
    break
  elif interaction.status == "failed":
    print(f"Research failed: {interaction.error}")
    break
  time.sleep(10)
      

REST

PROJECT_ID=PROJECT_ID;
curl --max-time 3600 --keepalive-time 10 -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    "https://aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/global/interactions" \
    -d '{
      "input": "Research the history of Google TPUs.",
      "agent": "deep-research-preview-04-2026",
      "background": true,
      "stream": true
    }'

API akan segera menampilkan interaction_id. ID ini diperlukan untuk terhubung kembali ke aliran data.

Streaming

Deep Research mendukung streaming untuk menerima update real-time tentang progres riset, termasuk ringkasan pemikiran, output teks, dan gambar yang dihasilkan. Anda harus menetapkan background=True dan stream=True.

Contoh berikut memulai tugas riset dan memproses streaming dengan koneksi ulang otomatis. Objek ini melacak interaction_id dan last_event_id sehingga jika koneksi terputus, koneksi dapat dilanjutkan dari bagian terakhir yang terputus.


from google import genai

client = genai.Client(enterprise=True, project="PROJECT_ID", location="global")

interaction_id = None
last_event_id = None
is_complete = False

def process_stream(stream):
  global interaction_id, last_event_id, is_complete
  for event in stream:
    if event.event_type == "interaction.created":
      interaction_id = event.interaction.id
    if event.event_id:
      last_event_id = event.event_id
    if event.event_type == "step.delta":
      if event.delta.type == "text":
        print(event.delta.text, end="", flush=True)
      elif event.delta.type == "thought":
        print(f"Thought: {event.delta.text}", flush=True)
    elif event.event_type in ("interaction.completed", "error"):
      is_complete = True

stream = client.interactions.create(
  input="Research the history of Google TPUs.",
  agent="deep-research-preview-04-2026",
  background=True,
  stream=True,
  agent_config={"type": "deep-research", "thinking_summaries": "auto"},
)

process_stream(stream)

while not is_complete and interaction_id:
  status = client.interactions.get(interaction_id)
  if status.status != "in_progress":
    break
  stream = client.interactions.get(
    id=interaction_id, stream=True, last_event_id=last_event_id,
  )
  process_stream(stream)

Menghubungkan kembali ke aliran interaksi

Untuk memulihkan streaming yang terputus, kirim permintaan GET menggunakan interaction_id asli. API akan memutar ulang semua peristiwa sebelumnya dari awal sesi sebelum melanjutkan dengan update real-time.

Python


response = client.interactions.get(
  id = 'INTERACTION_ID',
  stream=True
)
for chunk in response:
  print(chunk)
      

REST

PROJECT_ID=PROJECT_ID;
INTERACTION_ID=INTERACTION_ID

curl -X GET \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    "https://aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/global/interactions/${INTERACTION_ID}"

Alat

Deep Research mendukung beberapa alat bawaan dan eksternal. Secara default (jika tidak ada parameter alat yang diberikan), agen memiliki akses ke Google Penelusuran dan Konteks URL. Anda dapat secara eksplisit menentukan alat untuk membatasi atau memperluas kemampuan agen. Alat yang didukung meliputi:

Alat Kunci Catatan
Google Penelusuran google_search Telusuri web publik. Diaktifkan secara default.
Server MCP mcp_server Terhubung ke server MCP jarak jauh untuk akses alat eksternal.
Penelusuran Web Perusahaan enterprise_web_search Penelusuran web dengan kontrol kepatuhan tambahan.
Agent Search vertex_ai_search Telusuri data situs Anda atau kumpulan dokumen Anda.

Berikut ini memungkinkan Google Penelusuran sebagai satu-satunya alat:


interaction = client.interactions.create(
  agent="deep-research-preview-04-2026",
  input="What are the latest developments in quantum computing?",
  tools=[{"type": "google_search"}],
  background=True,
  stream=True
)

Server MCP

Berikan nama dan URL server dalam konfigurasi alat. Anda juga dapat meneruskan kredensial autentikasi dan membatasi alat yang dapat dipanggil oleh agen.

Lihat referensi berikut:

Kolom Jenis Wajib Deskripsi
type string Ya Harus berupa "mcp_server".
name string Tidak Nama tampilan untuk server MCP.
url string Tidak URL lengkap untuk endpoint server MCP.
headers objek Tidak Pasangan nilai kunci yang dikirim sebagai header HTTP dengan setiap permintaan ke server (misalnya, token autentikasi).
allowed_tools array Tidak Membatasi alat mana dari server yang dapat dipanggil oleh agen.

Lihat contoh berikut:


interaction = client.interactions.create(
  agent="deep-research-preview-04-2026",
  input="How to deploy an app to Cloud Run on Google Cloud?",
  tools=[
    {
      "type": "mcp_server",
      "name": "Google Cloud Developer Knowledge",
      "url": "https://developerknowledge.googleapis.com/mcp",
      "headers": {"Authorization": "Bearer token"},
    }
  ],
  background=True,
  stream=True
)

Penelusuran Web Perusahaan memungkinkan organisasi mendasarkan respons AI generatif pada data web yang aman, sesuai, dan terbaru. API ini memungkinkan developer dan bisnis menghubungkan model AI ke internet tanpa mengorbankan privasi data atau kepatuhan terhadap peraturan.

Lihat contoh berikut:


interaction = client.interactions.create(
  agent="deep-research-preview-04-2026",
  input="Research on the latest trend on AI",
  tools=[
    {
      "type": "google_search",
      "search_type": ["enterprise_web_search"],
    }
  ],
  background=True,
  stream=True
)

Input multimodal

Deep Research mendukung input multimodal, termasuk gambar dan dokumen (PDF), sehingga memungkinkan agen menganalisis konten visual dan melakukan riset berbasis web yang dikontekstualisasi oleh input yang diberikan.

Lihat contoh berikut:


prompt = """
Analyze the interspecies dynamics and behavioral risks present
in the provided image of the African watering hole. Specifically, investigate
the symbiotic relationship between the avian species and the pachyderms
shown, and conduct a risk assessment for the reticulated giraffes based on
their drinking posture relative to the specific predator visible in the
foreground.
"""

interaction = client.interactions.create(
  input=[
    {"type": "text", "text": prompt},
    {
      "type": "image",
      "uri": "https://storage.googleapis.com/generativeai-downloads/images/generated_elephants_giraffes_zebras_sunset.jpg"
    }
  ],
  agent="deep-research-preview-04-2026",
  background=True,
  stream=True
)

print(f"Research started: {interaction.id}")

while True:
  interaction = client.interactions.get(interaction.id)
  if interaction.status == "completed":
    print(interaction.steps[-1].content[0].text)
    break
  elif interaction.status == "failed":
    print(f"Research failed: {interaction.error}")
    break
  time.sleep(10)

Pemahaman dokumen

Anda dapat meneruskan dokumen secara langsung sebagai input multimodal. Agen menganalisis dokumen yang diberikan dan melakukan riset berdasarkan kontennya.

Lihat contoh berikut:


interaction = client.interactions.create(
  agent="deep-research-preview-04-2026",
  input=[
    {"type": "text", "text": "What is this document about?"},
    {
      "type": "document",
      "uri": "https://arxiv.org/pdf/1706.03762",
      "mime_type": "application/pdf",
    },
  ],
  background=True,
  stream=True
)

Kemampuan pengarahan dan pemformatan

Anda dapat mengarahkan output agen dengan memberikan petunjuk pemformatan tertentu dalam perintah Anda. Dengan begitu, Anda dapat menyusun laporan ke dalam bagian dan subbagian tertentu, menyertakan tabel data, atau menyesuaikan gaya bahasa untuk audiens yang berbeda, misalnya, "teknis", "eksekutif", atau "santai".

Tentukan output secara eksplisit dalam teks input Anda. Lihat contoh berikut:


prompt = """
Research the competitive landscape of EV batteries.

Format the output as a technical report with the following structure:
1. Executive Summary
2. Key Players (Must include a data table comparing capacity and chemistry)
3. Supply Chain Risks
"""

interaction = client.interactions.create(
    input=prompt,
    agent="deep-research-preview-04-2026",
    background=True,
    stream=True
)

Referensi API

Bagian ini memberikan informasi referensi API untuk menggunakan Agen Riset Mendalam Gemini.

Untuk mengetahui informasi selengkapnya, lihat Interactions API.

Metode: interactions.create

Nama lengkap: projects.locations.interactions.create

Memulai sesi Riset Mendalam baru.

Endpoint

postingan https://aiplatform.googleapis.com/v1beta1/{parent}/interactions

Parameter isi permintaan

Parameter isi permintaan dapat mencakup hal berikut:

Parameter Jenis Deskripsi
agent string Wajib. Menentukan kode ID agen (seperti deep-research-preview-04-2026).
background boolean Wajib. Menjalankan interaksi secara asinkron. Harus ditetapkan ke true.
stream boolean Wajib. Mengaktifkan streaming. Harus ditetapkan ke true.
input array atau string Wajib. Daftar yang berisi input pengguna. Hanya satu objek yang didukung.
tools array Mengganti alat default. Mendukung google_search, external_data_mcp, vertex_search, dll.

Waktu tunggu dan penanganan error

Saat berinteraksi dengan agen, Anda mungkin mengalami waktu tunggu koneksi habis atau error sistem. Bagian ini menjelaskan cara mengidentifikasi dan mengatasi waktu tunggu sementara dan kegagalan berat.

Waktu tunggu sementara

Waktu tunggu sementara terjadi saat koneksi Interactions API terputus saat agen masih memproses permintaan. Agen akan terus mengeksekusi permintaan di latar belakang.

Untuk melanjutkan sesi dan melihat peristiwa yang diputar ulang, hubungkan kembali ke streaming menggunakan interaction_id Anda. Lihat Menghubungkan kembali ke aliran interaksi.

Kegagalan berat

Kegagalan berat terjadi saat error agen atau sistem internal menghentikan konteks agen sepenuhnya. Error ini biasanya menampilkan kode status HTTP 500. Penyebab umum mencakup melebihi batas eksekusi 120 menit atau mengalami kegagalan sistem.

Untuk mengatasi kegagalan ini, hentikan sesi saat ini dan perbaiki kueri Anda sebelum Anda memulai sesi baru.

Praktik terbaik

Memberi agen otonom akses ke web dan file Anda akan memperkenalkan dinamika unik. Pertimbangkan praktik terbaik berikut saat menerapkan proyek Anda:

  • Perintah untuk hal yang tidak diketahui: Berikan petunjuk eksplisit kepada agen tentang cara menangani data yang tidak ada. Misalnya, minta untuk menyatakan apakah suatu angka tidak tersedia daripada memperkirakannya.

  • Hindari risiko injeksi perintah: Pastikan file yang diupload berasal dari sumber tepercaya, karena file berbahaya dapat berisi teks tersembunyi yang dirancang untuk memanipulasi output agen.

  • Hindari eksfiltrasi data: Berhati-hatilah saat meminta agen untuk meringkas data internal sensitif sekaligus memberinya akses untuk menjelajahi web publik.

  • Verifikasi kutipan: Meskipun pemfilteran tingkat perusahaan diterapkan, selalu verifikasi kutipan yang diberikan dalam respons untuk memastikan sumber webnya bereputasi baik.

Batasan

Pertimbangkan batasan berikut saat Anda merencanakan project:

  • Hanya sekali interaksi: Hanya kueri sekali interaksi yang didukung. Penggunaan kolom previous_interaction_id API tidak didukung.

  • Keamanan tingkat perusahaan: Selama Pratinjau, kunci enkripsi yang dikelola pelanggan (CMEK) dan Kontrol Layanan VPC tidak didukung. Batasan residensi data multi-region sedang dievaluasi.

  • Caching: Caching implisit diaktifkan secara default untuk layanan ini. Fitur ini tidak dapat dinonaktifkan.

  • Retensi data: Perintah dan output yang dihasilkan disimpan selama tujuh hari untuk pemrosesan standar. Saat menggunakan Grounding dengan Google Penelusuran, Google menyimpan perintah, informasi kontekstual, dan output yang dihasilkan selama tiga hari untuk proses debug dan pengujian. Jika Anda menggunakan Perujukan dengan Google Penelusuran, Anda tidak dapat menonaktifkan penyimpanan informasi ini. Jika Anda memerlukan retensi data nol, sebaiknya gunakan Perujukan dengan Penelusuran Web Enterprise.

Harga

Deep Research menggunakan fitur penalaran canggih Gemini untuk melakukan tugas riset agentik multi-langkah. Penagihan terdiri dari penggunaan model (token) dan eksekusi alat (penelusuran dan perujukan).

Untuk informasi selengkapnya, buka Harga.

Pelacakan Biaya

Secara default, Agen Riset Mendalam Gemini otomatis menerapkan label pengguna is_deep_research ke operasinya. Di Google Cloud, label adalah pasangan nilai kunci ringan yang digunakan untuk mengatur resource dan melacak biaya di seluruh infrastruktur Anda.

  • Pemberian label otomatis: Anda tidak perlu mengonfigurasi label ini secara manual dalam permintaan API; agen menyertakan label is_deep_research secara default untuk semua tugas yang dijalankan.

  • Pemfilteran penagihan: Laporan penagihan Deep Research dapat difilter menggunakan is_deep_research label penagihan.

  • Pelacakan komprehensif: Label penagihan is_deep_research berlaku untuk penggunaan model (token input dan output) dan eksekusi alat (penggunaan penelusuran dan perujukan) Anda. Hal ini membantu Anda menggabungkan dan menghitung total biaya alur kerja riset asinkron Anda.

Kuota

Untuk mengakomodasi traffic yang lebih tinggi, tugas latar belakang serentak, atau beban riset yang lebih berat, Anda dapat meminta peningkatan kuota untuk Agent Platform API langsung dalam project Google Cloud Anda.

Untuk meningkatkan kuota, lakukan tindakan berikut:

  1. Di konsol Google Cloud , buka halaman Quotas & system limits.

    Buka Quotas and system limits

  2. Pastikan Anda telah memilih project yang benar yang menjalankan workload Riset Mendalam Anda.

  3. Di kotak penelusuran filter, telusuri Agent Platform API (aiplatform.googleapis.com) untuk menemukan kuota interaksi dan agen yang relevan.

  4. Pilih batas kuota tertentu yang perlu Anda sesuaikan.

  5. Klik Edit kuota.

  6. Di dialog Perubahan kuota, di kolom Nilai baru, masukkan batas yang Anda minta. Berikan justifikasi yang jelas dalam deskripsi permintaan. Menyebutkan kasus penggunaan Deep Research spesifik, kebutuhan eksekusi di latar belakang, dan pola traffic yang diharapkan dapat membantu mempercepat proses persetujuan.

  7. Klik Submit request.

Kepatuhan dan keamanan

Bagian ini menjelaskan cara data Anda dipertahankan dan di-cache, serta mencantumkan kontrol keamanan yang tidak didukung selama Pratinjau.

Retensi data

Perintah dan Output yang Dihasilkan disimpan selama tujuh (7) hari untuk pemrosesan standar.

Seperti yang diuraikan dalam Pasal 19 "Layanan AI Generatif: Perujukan dengan Google Penelusuran" dalam Persyaratan Khusus Layanan, Google menyimpan perintah dan informasi kontekstual yang mungkin diberikan pelanggan, serta output yang dihasilkan selama tiga (3) hari untuk tujuan pembuatan hasil yang dirujuk dan saran penelusuran, dan informasi yang disimpan ini dapat digunakan untuk proses debug dan pengujian sistem yang mendukung perujukan dengan Google Penelusuran. Tidak ada cara untuk menonaktifkan penyimpanan informasi ini jika Anda menggunakan Perujukan dengan Google Penelusuran. Jika Anda memerlukan retensi data nol, sebaiknya gunakan Perujukan Web untuk Perusahaan.

Caching

Caching implisit diaktifkan secara default untuk Deep Research dan tidak dapat dinonaktifkan.

Kontrol keamanan

Kontrol keamanan berikut tidak didukung selama Pratinjau:

  • Kunci enkripsi yang dikelola pelanggan (Customer-Managed Encryption Key/CMEK)
  • Kontrol Layanan VPC (VPC-SC)
  • Transparansi Akses (AXT)
  • Residensi data
  • Residensi data multi-region

Langkah berikutnya

Referensi

Pelajari Interactions API, yang memungkinkan Anda berinteraksi dengan agen.

Tutorial

Mulai menggunakan notebook Python Deep Research ini di GitHub.