Gemini 3 Pro

Gemini 3 Pro adalah model Gemini penalaran tercanggih kami, yang mampu menyelesaikan masalah kompleks. Gemini 3 Pro dapat memahami set data yang luas dan masalah yang menantang dari berbagai sumber informasi, termasuk teks, audio, gambar, video, PDF, dan bahkan keseluruhan repositori kode dengan jendela konteks token 1 juta.

Perubahan kualitas

Saat bermigrasi dari Gemini 2.5 Pro ke Gemini 3 Pro, Anda dapat melihat peningkatan signifikan dalam penalaran tingkat tinggi, mengikuti petunjuk yang kompleks, penggunaan alat, kasus penggunaan agen, dan kemampuan konteks panjang yang lebih baik (termasuk pemahaman gambar dan dokumen). Model Gemini 3 Pro tidak dirancang untuk memprioritaskan dukungan kasus penggunaan pemahaman audio atau segmentasi gambar. Untuk output berperforma tinggi pada kasus penggunaan tersebut, coba gunakan model yang dibuat khusus dengan mempertimbangkan kebutuhan tersebut. Untuk grafik, tabel, atau diagram yang padat informasi atau rumit, model terkadang dapat salah mengekstrak informasi atau salah menafsirkan resource yang diberikan. Menyajikan informasi utama dengan cara yang sesederhana mungkin dapat membantu memastikan output yang diinginkan saat menggunakan Gemini 3 Pro.

Perubahan perilaku

Gemini 3 Pro dirancang untuk efisiensi dan tindakan yang tinggi. Model ini telah dilatih untuk memberikan jawaban yang ringkas dan langsung serta mencoba menyelesaikan maksud pengguna secepat mungkin. Karena model ini dirancang untuk memprioritaskan bantuan, model ini terkadang dapat menebak saat informasi tidak ada atau memprioritaskan jawaban yang memuaskan daripada petunjuk yang ketat. Perilaku ini dapat dikurangi atau diubah dengan perintah. Untuk mengetahui informasi dan praktik terbaik selengkapnya, lihat Memulai Gemini 3.

Fitur baru

Gemini 3 Pro memperkenalkan beberapa fitur baru untuk meningkatkan performa, kontrol, dan fidelitas multimodal:

  • Tingkat penalaran: Gunakan parameter thinking_level untuk mengontrol jumlah penalaran internal yang dilakukan model (rendah atau tinggi) guna menyeimbangkan kualitas respons, kompleksitas penalaran, latensi, dan biaya. Parameter thinking_level menggantikan thinking_budget untuk model Gemini 3.
  • Resolusi media: Gunakan parameter media_resolution(rendah, sedang, atau tinggi) untuk mengontrol pemrosesan visi untuk input multimodal, yang memengaruhi penggunaan token dan latensi. Lihat Memulai Gemini 3 untuk setelan resolusi default.
  • Tanda tangan pemikiran: Validasi tanda tangan pemikiran yang lebih ketat meningkatkan keandalan dalam panggilan fungsi multi-turn.
  • Respons fungsi multimodal: Respons fungsi kini dapat menyertakan objek multimodal seperti gambar dan PDF selain teks.
  • Streaming panggilan fungsi: Streaming argumen panggilan fungsi parsial untuk meningkatkan pengalaman pengguna selama penggunaan alat.

Untuk mengetahui informasi selengkapnya tentang cara menggunakan fitur ini, lihat Memulai Gemini 3.

Coba di Platform Agen Tampilan di Model Garden (Pratinjau) Men-deploy aplikasi contoh

Catatan: Untuk menggunakan fitur "Deploy example app", Anda memerlukan project Google Cloud dengan penagihan dan Agent Platform API yang diaktifkan.
ID Model gemini-3-pro-preview
Input &output yang didukung
  • Input:
    Teks, Kode, Gambar, Audio, Video, PDF
  • Output:
    Teks
Batas token
  • Token input maksimum: 1.048.576
  • Token output maksimum: 65.536
Kemampuan
Opsi pemakaian
Lihat Opsi pemakaian untuk mengetahui informasi selengkapnya.
Spesifikasi teknis
Gambar
  • Jumlah gambar maksimum per perintah: 3.000
  • Ukuran file maksimum per file untuk data inline atau upload langsung melalui konsol: 7 MB
  • Ukuran file maksimum per file dari Google Cloud Storage: 30 MB
  • Token resolusi default: 1.120
  • Jenis MIME yang didukung:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Dokumen
  • Jumlah file maksimum per perintah: 3.000
  • Jumlah halaman maksimum per file: 3.000
  • Ukuran file maksimum per file untuk impor API atau Cloud Storage: 50 MB(application/pdf) atau 7 MB(text/plain)
  • Ukuran file maksimum per file untuk upload langsung melalui konsol: 7 MB
  • Token resolusi default: 560
  • OCR untuk PDF yang dipindai: Tidak digunakan secara default
  • Jenis MIME yang didukung:
    application/pdf, text/plain
Video
  • Durasi video maksimum (dengan audio): Sekitar 45 menit
  • Durasi video maksimum (tanpa audio): Sekitar 1 jam
  • Jumlah video maksimum per perintah: 10
  • Token resolusi default per frame: 70
  • Jenis MIME yang didukung:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durasi audio maksimum per perintah: Sekitar 8,4 jam, atau hingga 1 juta token
  • Jumlah file audio maksimum per perintah: 1
  • Pemahaman ucapan untuk: Pembuatan ringkasan audio, transkripsi, dan terjemahan
  • Jenis MIME yang didukung:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Default parameter
  • Temperatur: 0,0-2,0 (default 1,0)
  • topP: 0,0-1,0 (default 0,95)
  • topK: 64 (tetap)
  • candidateCount: 1–8 (default 1)
Region yang didukung

Ketersediaan model

  • Global
    • global
Lihat Deployment dan endpoint untuk mengetahui informasi selengkapnya.
Tanggal batas informasi Januari 2025
Versi
  • gemini-3-pro-preview
    • Tahap peluncuran: Pratinjau publik
    • Tanggal rilis: 18 November 2025
    • Tanggal penghentian: 26 Maret 2026
Bahasa yang didukung Lihat Bahasa yang didukung.
Harga Lihat Harga.