Agen Deep Research Gemini adalah agen AI terkelola yang dirancang untuk merencanakan, mengeksekusi, dan menyintesis alur kerja riset multi-langkah yang kompleks. Didukung oleh Gemini, agen ini menjelajahi berbagai lanskap informasi, termasuk web publik dan data perusahaan pribadi untuk membuat laporan komprehensif yang dikutip dan mempercepat pengambilan keputusan yang tepat.
Halaman ini membahas cara menggunakan Agen Riset Mendalam Gemini, termasuk kemampuan dan batasan utamanya, cara memulai tugas riset, serta cara menangani waktu tunggu dan penanganan error.
Kapan menggunakan Deep Research
Deep Research adalah agen, bukan hanya model. Cara ini paling cocok untuk workload yang memungkinkan pendekatan analisis asinkron, bukan chat latensi rendah.
Pertimbangkan keunggulan Deep Research berikut saat Anda merencanakan project Anda:
Proses berulang: Alih-alih membuat respons instan seperti model chat standar, Riset Mendalam mengikuti alur kerja multi-langkah yang metodis: Rencanakan > Penelusuran multi-sumber > Ulangi > Output.
Beban kerja tingkat lanjut: Deep Research secara khusus dirancang untuk menangani tugas kompleks seperti uji tuntas, analisis pasar, dan lanskap persaingan.
Perujukan data yang ekstensif: Agen Deep Research Gemini dapat melakukan penalaran di berbagai sumber data secara bersamaan. Hal ini mencakup server MCP jarak jauh, pengetahuan institusional internal, dan konteks langsung dari file atau folder yang diupload.
Pelaporan yang lebih baik: Menghasilkan laporan komprehensif yang mencantumkan kutipan dan dapat menampilkan visual yang siap digunakan dalam presentasi. Hal ini mencakup grafik keuangan, infografik inline, dan matriks posisi pasar, yang dibuat menggunakan HTML dan model gambar.
Kemampuan pengarahan yang tinggi: Anda dapat menyesuaikan output akhir secara langsung dalam perintah Anda. Hal ini mencakup menetapkan gaya bahasa tertentu (misalnya, teknis atau eksekutif), menentukan format yang ketat, atau meminta tabel data terstruktur.
Tabel berikut membandingkan Agen Riset Mendalam Gemini dengan model Gemini standar di berbagai metrik, termasuk latensi, output, dan kegunaan masing-masing model:
| Fitur | Model Gemini standar | Agen Deep Research Gemini |
|---|---|---|
| Latensi | Detik | Menit |
| Proses | Buat → Output | Rencanakan → Penelusuran multi-sumber → Ulangi → Output |
| Output | Teks dan kode gaya percakapan | Laporan yang mendetail dan dikutip dengan diagram dan gambar inline |
| Paling cocok untuk | Chatbot, ekstraksi informasi, peringkasan | Analisis pasar, riset mendalam, lanskap persaingan |
Kemampuan utama
Deep Research dilengkapi dengan fitur dan kemampuan berikut:
- Perujukan pada beberapa sumber, termasuk:
- Server MCP jarak jauh
- Melakukan grounding dengan Penelusuran Agen
- Grounding dengan Google Penelusuran atau Grounding Web untuk Perusahaan, yang didukung oleh standar privasi dan pemfilteran ketat yang sesuai untuk beban kerja perusahaan
- Upload file dan folder inline (seperti PDF dan spreadsheet), sehingga Anda dapat langsung memasukkan konteks ke dalam alur kerja riset dan mendapatkan kutipan
- Output gambar dan diagram: Buat laporan mendetail yang berisi aset siap presentasi seperti infografik inline, diagram matriks posisi pasar, dan grafik performa keuangan
- Kutipan inline
Cara menggunakan Deep Research
Anda dapat mengakses Agen Riset Mendalam Gemini menggunakan endpoint global (v1beta1) dengan menggunakan Google Gen AI SDK atau permintaan REST API langsung. Untuk contoh penggunaan, lihat Introduction to Gemini Deep Research Pro notebook on GitHub.
Sebelum memulai
- Login ke akun Google Cloud Anda. Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Agent Platform API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
Make sure that you have the following role or roles on the project: roles/aiplatform.user, roles/serviceusage.serviceUsageConsumer
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
- Click Grant access.
-
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
- Click Select a role, then search for the role.
- To grant additional roles, click Add another role and add each additional role.
- Click Save.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
Enable the Agent Platform API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
Make sure that you have the following role or roles on the project: roles/aiplatform.user, roles/serviceusage.serviceUsageConsumer
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
- Click Grant access.
-
In the New principals field, enter your user identifier. This is typically the email address for a Google Account.
- Click Select a role, then search for the role.
- To grant additional roles, click Add another role and add each additional role.
- Click Save.
-
Memulai tugas Deep Research
Tugas riset melibatkan penelusuran dan pembacaan secara iteratif, dan dapat memerlukan waktu beberapa menit untuk diselesaikan. Anda harus menjalankan Agen Deep Research Gemini secara asinkron.
Anda harus menggunakan eksekusi latar belakang dan mode streaming. Untuk melakukannya, tetapkan
kolom background dan stream ke True dalam konfigurasi
respons saat Anda menjalankan agen. API segera menampilkan objek Interaction parsial. Anda dapat menggunakan properti id untuk mengambil
interaksi untuk polling. Status interaksi akan bertransisi dari
in_progress ke completed atau failed.
Python
import time
from google import genai
client = genai.Client(enterprise=True, project="PROJECT_ID", location="global")
interaction = client.interactions.create(
input="Analyze competitive positioning for solar energy providers.",
agent="deep-research-preview-04-2026",
background=True,
stream=True
)
print(f"Research started: {interaction.id}")
while True:
interaction = client.interactions.get(interaction.id)
if interaction.status == "completed":
print(interaction.steps[-1].content[0].text)
break
elif interaction.status == "failed":
print(f"Research failed: {interaction.error}")
break
time.sleep(10)
REST
PROJECT_ID=PROJECT_ID;
curl --max-time 3600 --keepalive-time 10 -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/global/interactions" \
-d '{
"input": "Research the history of Google TPUs.",
"agent": "deep-research-preview-04-2026",
"background": true,
"stream": true
}'API akan segera menampilkan interaction_id. ID ini diperlukan untuk terhubung kembali ke aliran data.
Streaming
Deep Research mendukung streaming untuk menerima update real-time tentang progres riset, termasuk ringkasan pemikiran, output teks, dan gambar yang dihasilkan. Anda harus menetapkan background=True dan stream=True.
Contoh berikut memulai tugas riset dan memproses streaming
dengan koneksi ulang otomatis. Objek ini melacak interaction_id dan
last_event_id sehingga jika koneksi terputus, koneksi dapat dilanjutkan dari bagian terakhir
yang terputus.
from google import genai
client = genai.Client(enterprise=True, project="PROJECT_ID", location="global")
interaction_id = None
last_event_id = None
is_complete = False
def process_stream(stream):
global interaction_id, last_event_id, is_complete
for event in stream:
if event.event_type == "interaction.created":
interaction_id = event.interaction.id
if event.event_id:
last_event_id = event.event_id
if event.event_type == "step.delta":
if event.delta.type == "text":
print(event.delta.text, end="", flush=True)
elif event.delta.type == "thought":
print(f"Thought: {event.delta.text}", flush=True)
elif event.event_type in ("interaction.completed", "error"):
is_complete = True
stream = client.interactions.create(
input="Research the history of Google TPUs.",
agent="deep-research-preview-04-2026",
background=True,
stream=True,
agent_config={"type": "deep-research", "thinking_summaries": "auto"},
)
process_stream(stream)
while not is_complete and interaction_id:
status = client.interactions.get(interaction_id)
if status.status != "in_progress":
break
stream = client.interactions.get(
id=interaction_id, stream=True, last_event_id=last_event_id,
)
process_stream(stream)
Menghubungkan kembali ke aliran interaksi
Untuk memulihkan streaming yang terputus, kirim permintaan GET menggunakan
interaction_id asli. API akan memutar ulang semua peristiwa sebelumnya dari awal sesi sebelum melanjutkan dengan update real-time.
Python
response = client.interactions.get(
id = 'INTERACTION_ID',
stream=True
)
for chunk in response:
print(chunk)
REST
PROJECT_ID=PROJECT_ID;
INTERACTION_ID=INTERACTION_ID
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://aiplatform.googleapis.com/v1beta1/projects/${PROJECT_ID}/locations/global/interactions/${INTERACTION_ID}"Alat
Deep Research mendukung beberapa alat bawaan dan eksternal. Secara default (jika tidak ada parameter alat yang diberikan), agen memiliki akses ke Google Penelusuran dan Konteks URL. Anda dapat secara eksplisit menentukan alat untuk membatasi atau memperluas kemampuan agen. Alat yang didukung meliputi:
| Alat | Kunci | Catatan |
|---|---|---|
| Google Penelusuran | google_search
|
Telusuri web publik. Diaktifkan secara default. |
| Server MCP | mcp_server
|
Terhubung ke server MCP jarak jauh untuk akses alat eksternal. |
| Penelusuran Web Perusahaan | enterprise_web_search
|
Penelusuran web dengan kontrol kepatuhan tambahan. |
| Agent Search | vertex_ai_search
|
Telusuri data situs Anda atau kumpulan dokumen Anda. |
Google Penelusuran
Berikut ini memungkinkan Google Penelusuran sebagai satu-satunya alat:
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="What are the latest developments in quantum computing?",
tools=[{"type": "google_search"}],
background=True,
stream=True
)
Server MCP
Berikan nama dan URL server dalam konfigurasi alat. Anda juga dapat meneruskan kredensial autentikasi dan membatasi alat yang dapat dipanggil oleh agen.
Lihat referensi berikut:
| Kolom | Jenis | Wajib | Deskripsi |
|---|---|---|---|
type |
string | Ya | Harus berupa "mcp_server". |
name |
string | Tidak | Nama tampilan untuk server MCP. |
url
|
string | Tidak | URL lengkap untuk endpoint server MCP. |
headers
|
objek | Tidak | Pasangan nilai kunci yang dikirim sebagai header HTTP dengan setiap permintaan ke server (misalnya, token autentikasi). |
allowed_tools
|
array | Tidak | Membatasi alat mana dari server yang dapat dipanggil oleh agen. |
Lihat contoh berikut:
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="How to deploy an app to Cloud Run on Google Cloud?",
tools=[
{
"type": "mcp_server",
"name": "Google Cloud Developer Knowledge",
"url": "https://developerknowledge.googleapis.com/mcp",
"headers": {"Authorization": "Bearer token"},
}
],
background=True,
stream=True
)
Penelusuran Web Perusahaan
Penelusuran Web Perusahaan memungkinkan organisasi mendasarkan respons AI generatif pada data web yang aman, sesuai, dan terbaru. API ini memungkinkan developer dan bisnis menghubungkan model AI ke internet tanpa mengorbankan privasi data atau kepatuhan terhadap peraturan.
Lihat contoh berikut:
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input="Research on the latest trend on AI",
tools=[
{
"type": "google_search",
"search_type": ["enterprise_web_search"],
}
],
background=True,
stream=True
)
Input multimodal
Deep Research mendukung input multimodal, termasuk gambar dan dokumen (PDF), sehingga memungkinkan agen menganalisis konten visual dan melakukan riset berbasis web yang dikontekstualisasi oleh input yang diberikan.
Lihat contoh berikut:
prompt = """
Analyze the interspecies dynamics and behavioral risks present
in the provided image of the African watering hole. Specifically, investigate
the symbiotic relationship between the avian species and the pachyderms
shown, and conduct a risk assessment for the reticulated giraffes based on
their drinking posture relative to the specific predator visible in the
foreground.
"""
interaction = client.interactions.create(
input=[
{"type": "text", "text": prompt},
{
"type": "image",
"uri": "https://storage.googleapis.com/generativeai-downloads/images/generated_elephants_giraffes_zebras_sunset.jpg"
}
],
agent="deep-research-preview-04-2026",
background=True,
stream=True
)
print(f"Research started: {interaction.id}")
while True:
interaction = client.interactions.get(interaction.id)
if interaction.status == "completed":
print(interaction.steps[-1].content[0].text)
break
elif interaction.status == "failed":
print(f"Research failed: {interaction.error}")
break
time.sleep(10)
Pemahaman dokumen
Anda dapat meneruskan dokumen secara langsung sebagai input multimodal. Agen menganalisis dokumen yang diberikan dan melakukan riset berdasarkan kontennya.
Lihat contoh berikut:
interaction = client.interactions.create(
agent="deep-research-preview-04-2026",
input=[
{"type": "text", "text": "What is this document about?"},
{
"type": "document",
"uri": "https://arxiv.org/pdf/1706.03762",
"mime_type": "application/pdf",
},
],
background=True,
stream=True
)
Kemampuan pengarahan dan pemformatan
Anda dapat mengarahkan output agen dengan memberikan petunjuk pemformatan tertentu dalam perintah Anda. Dengan begitu, Anda dapat menyusun laporan ke dalam bagian dan subbagian tertentu, menyertakan tabel data, atau menyesuaikan gaya bahasa untuk audiens yang berbeda, misalnya, "teknis", "eksekutif", atau "santai".
Tentukan output secara eksplisit dalam teks input Anda. Lihat contoh berikut:
prompt = """
Research the competitive landscape of EV batteries.
Format the output as a technical report with the following structure:
1. Executive Summary
2. Key Players (Must include a data table comparing capacity and chemistry)
3. Supply Chain Risks
"""
interaction = client.interactions.create(
input=prompt,
agent="deep-research-preview-04-2026",
background=True,
stream=True
)
Referensi API
Bagian ini memberikan informasi referensi API untuk menggunakan Agen Riset Mendalam Gemini.
Untuk mengetahui informasi selengkapnya, lihat Interactions API.
Metode: interactions.create
Nama lengkap: projects.locations.interactions.create
Memulai sesi Riset Mendalam baru.
Endpoint
postingan
https:
Parameter isi permintaan
Parameter isi permintaan dapat mencakup hal berikut:
| Parameter | Jenis | Deskripsi |
|---|---|---|
agent
|
string
|
Wajib. Menentukan kode ID agen (seperti
deep-research-preview-04-2026). |
background
|
boolean
|
Wajib. Menjalankan interaksi secara asinkron.
Harus ditetapkan ke true. |
stream
|
boolean
|
Wajib. Mengaktifkan streaming. Harus ditetapkan ke
true. |
input
|
array
atau
string |
Wajib. Daftar yang berisi input pengguna. Hanya satu objek yang didukung. |
tools
|
array
|
Mengganti alat default. Mendukung
google_search, external_data_mcp,
vertex_search, dll. |
Waktu tunggu dan penanganan error
Saat berinteraksi dengan agen, Anda mungkin mengalami waktu tunggu koneksi habis atau error sistem. Bagian ini menjelaskan cara mengidentifikasi dan mengatasi waktu tunggu sementara dan kegagalan berat.
Waktu tunggu sementara
Waktu tunggu sementara terjadi saat koneksi Interactions API terputus saat agen masih memproses permintaan. Agen akan terus mengeksekusi permintaan di latar belakang.
Untuk melanjutkan sesi dan melihat peristiwa yang diputar ulang, hubungkan kembali ke streaming menggunakan
interaction_id Anda. Lihat Menghubungkan kembali ke aliran interaksi.
Kegagalan berat
Kegagalan berat terjadi saat error agen atau sistem internal menghentikan konteks agen sepenuhnya. Error ini biasanya menampilkan kode status HTTP 500. Penyebab umum mencakup melebihi batas eksekusi 120 menit atau mengalami kegagalan sistem.
Untuk mengatasi kegagalan ini, hentikan sesi saat ini dan perbaiki kueri Anda sebelum Anda memulai sesi baru.
Praktik terbaik
Memberi agen otonom akses ke web dan file Anda akan memperkenalkan dinamika unik. Pertimbangkan praktik terbaik berikut saat menerapkan proyek Anda:
Perintah untuk hal yang tidak diketahui: Berikan petunjuk eksplisit kepada agen tentang cara menangani data yang tidak ada. Misalnya, minta untuk menyatakan apakah suatu angka tidak tersedia daripada memperkirakannya.
Hindari risiko injeksi perintah: Pastikan file yang diupload berasal dari sumber tepercaya, karena file berbahaya dapat berisi teks tersembunyi yang dirancang untuk memanipulasi output agen.
Hindari eksfiltrasi data: Berhati-hatilah saat meminta agen untuk meringkas data internal sensitif sekaligus memberinya akses untuk menjelajahi web publik.
Verifikasi kutipan: Meskipun pemfilteran tingkat perusahaan diterapkan, selalu verifikasi kutipan yang diberikan dalam respons untuk memastikan sumber webnya bereputasi baik.
Batasan
Pertimbangkan batasan berikut saat Anda merencanakan project:
Hanya sekali interaksi: Hanya kueri sekali interaksi yang didukung. Penggunaan kolom
previous_interaction_idAPI tidak didukung.Keamanan tingkat perusahaan: Selama Pratinjau, kunci enkripsi yang dikelola pelanggan (CMEK) dan Kontrol Layanan VPC tidak didukung. Batasan residensi data multi-region sedang dievaluasi.
Caching: Caching implisit diaktifkan secara default untuk layanan ini. Fitur ini tidak dapat dinonaktifkan.
Retensi data: Perintah dan output yang dihasilkan disimpan selama tujuh hari untuk pemrosesan standar. Saat menggunakan Grounding dengan Google Penelusuran, Google menyimpan perintah, informasi kontekstual, dan output yang dihasilkan selama tiga hari untuk proses debug dan pengujian. Jika Anda menggunakan Perujukan dengan Google Penelusuran, Anda tidak dapat menonaktifkan penyimpanan informasi ini. Jika Anda memerlukan retensi data nol, sebaiknya gunakan Perujukan dengan Penelusuran Web Enterprise.
Harga
Deep Research menggunakan fitur penalaran canggih Gemini untuk melakukan tugas riset agentik multi-langkah. Penagihan terdiri dari penggunaan model (token) dan eksekusi alat (penelusuran dan perujukan).
Untuk informasi selengkapnya, buka Harga.
Pelacakan Biaya
Secara default, Agen Riset Mendalam Gemini otomatis menerapkan label pengguna is_deep_research ke operasinya. Di Google Cloud, label adalah
pasangan nilai kunci ringan yang digunakan untuk mengatur resource dan melacak biaya
di seluruh infrastruktur Anda.
Pemberian label otomatis: Anda tidak perlu mengonfigurasi label ini secara manual dalam permintaan API; agen menyertakan label
is_deep_researchsecara default untuk semua tugas yang dijalankan.Pemfilteran penagihan: Laporan penagihan Deep Research dapat difilter menggunakan
is_deep_researchlabel penagihan.Pelacakan komprehensif: Label penagihan
is_deep_researchberlaku untuk penggunaan model (token input dan output) dan eksekusi alat (penggunaan penelusuran dan perujukan) Anda. Hal ini membantu Anda menggabungkan dan menghitung total biaya alur kerja riset asinkron Anda.
Kuota
Untuk mengakomodasi traffic yang lebih tinggi, tugas latar belakang serentak, atau beban riset yang lebih berat, Anda dapat meminta peningkatan kuota untuk Agent Platform API langsung dalam project Google Cloud Anda.
Untuk meningkatkan kuota, lakukan tindakan berikut:
Di konsol Google Cloud , buka halaman Quotas & system limits.
Pastikan Anda telah memilih project yang benar yang menjalankan workload Riset Mendalam Anda.
Di kotak penelusuran filter, telusuri Agent Platform API (
aiplatform.googleapis.com) untuk menemukan kuota interaksi dan agen yang relevan.Pilih batas kuota tertentu yang perlu Anda sesuaikan.
Klik Edit kuota.
Di dialog Perubahan kuota, di kolom Nilai baru, masukkan batas yang Anda minta. Berikan justifikasi yang jelas dalam deskripsi permintaan. Menyebutkan kasus penggunaan Deep Research spesifik, kebutuhan eksekusi di latar belakang, dan pola traffic yang diharapkan dapat membantu mempercepat proses persetujuan.
Klik Submit request.
Kepatuhan dan keamanan
Bagian ini menjelaskan cara data Anda dipertahankan dan di-cache, serta mencantumkan kontrol keamanan yang tidak didukung selama Pratinjau.
Retensi data
Perintah dan Output yang Dihasilkan disimpan selama tujuh (7) hari untuk pemrosesan standar.
Seperti yang diuraikan dalam Pasal 19 "Layanan AI Generatif: Perujukan dengan Google Penelusuran" dalam Persyaratan Khusus Layanan, Google menyimpan perintah dan informasi kontekstual yang mungkin diberikan pelanggan, serta output yang dihasilkan selama tiga (3) hari untuk tujuan pembuatan hasil yang dirujuk dan saran penelusuran, dan informasi yang disimpan ini dapat digunakan untuk proses debug dan pengujian sistem yang mendukung perujukan dengan Google Penelusuran. Tidak ada cara untuk menonaktifkan penyimpanan informasi ini jika Anda menggunakan Perujukan dengan Google Penelusuran. Jika Anda memerlukan retensi data nol, sebaiknya gunakan Perujukan Web untuk Perusahaan.
Caching
Caching implisit diaktifkan secara default untuk Deep Research dan tidak dapat dinonaktifkan.
Kontrol keamanan
Kontrol keamanan berikut tidak didukung selama Pratinjau:
- Kunci enkripsi yang dikelola pelanggan (Customer-Managed Encryption Key/CMEK)
- Kontrol Layanan VPC (VPC-SC)
- Transparansi Akses (AXT)
- Residensi data
- Residensi data multi-region
Langkah berikutnya
Referensi Interactions API
Pelajari Interactions API, yang memungkinkan Anda berinteraksi dengan agen.
Notebook: Pengantar Gemini Deep Research Agent
Mulai menggunakan notebook Python Deep Research ini di GitHub.