Gemini 3 Flash

Gemini 3 Flash menggabungkan kemampuan penalaran Gemini 3 Pro dengan tingkat latensi, efisiensi, dan biaya lini Flash. Model ini tidak hanya memungkinkan tugas sehari-hari dengan penalaran yang lebih baik, tetapi juga dirancang untuk menangani alur kerja agentik yang paling kompleks.

Gemini 3 Flash menggunakan beberapa fitur baru untuk meningkatkan performa, kontrol, dan kualitas multimodal:

  • Tingkat penalaran: Gunakan parameter thinking_level untuk mengontrol jumlah penalaran internal yang dilakukan model (minimal, rendah, sedang, atau tinggi) untuk menyeimbangkan kualitas respons, kompleksitas penalaran, latensi, dan biaya. Parameter thinking_level menggantikan thinking_budget untuk model Gemini 3.

    Untuk mengetahui detail tentang berbagai tingkat pemikiran, lihat Berpikir.

  • Tanda tangan pemikiran: Validasi yang lebih ketat terhadap tanda tangan pemikiran meningkatkan keandalan dalam panggilan fungsi multi-turn.

  • Resolusi media: Gunakan parameter media_resolution (rendah, sedang, tinggi, atau sangat tinggi) untuk mengontrol pemrosesan penglihatan untuk input multimodal, yang memengaruhi penggunaan token dan latensi. Lihat Mulai menggunakan Gemini 3 untuk setelan resolusi default.

    • Tingkat resolusi media sangat tinggi hanya tersedia untuk modalitas IMAGE.
    • Jumlah token PDF akan dicantumkan dalam modalitas IMAGE, bukan modalitas DOCUMENT di usage_metadata.
  • Respons fungsi multimodal: Respons fungsi kini dapat menyertakan objek multimodal seperti gambar dan PDF selain teks.

  • Panggilan Fungsi Streaming: Streaming argumen panggilan fungsi parsial untuk meningkatkan pengalaman pengguna selama penggunaan alat.

Untuk mengetahui informasi selengkapnya tentang cara menggunakan fitur ini, lihat Mulai menggunakan Gemini 3.

Coba di Vertex AI Lihat di Model Garden (Pratinjau) Deploy aplikasi contoh

Catatan: Untuk menggunakan fitur "Deploy example app", Anda memerlukan project Google Cloud dengan penagihan dan Vertex AI API yang diaktifkan.
ID Model gemini-3-flash-preview
Input & output yang didukung
  • Input:
    Teks, Kode, Gambar, Audio, Video, PDF
  • Output:
    Teks
Batas token
  • Token input maksimum: 1.048.576
  • Token output maksimum: 65.536
Kemampuan
Jenis penggunaan
Spesifikasi teknis
Gambar
  • Gambar maksimum per perintah: 900
  • Ukuran file maksimum per file untuk data inline atau upload langsung melalui konsol: 7 MB
  • Ukuran file maksimum per file dari Google Cloud Storage: 30 MB
  • Token resolusi default: 1120
  • Jenis MIME yang didukung:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Dokumen
  • Jumlah maksimum file per perintah: 900
  • Jumlah maksimum halaman per file: 900
  • Ukuran file maksimum per file untuk impor API atau Cloud Storage: 50 MB
  • Ukuran file maksimum per file untuk upload langsung melalui konsol: 7 MB
  • Token resolusi default: 560
  • OCR untuk PDF hasil pindaian: Tidak digunakan secara default
  • Jenis MIME yang didukung:
    application/pdf, text/plain
Video
  • Durasi video maksimum (dengan audio): Sekitar 45 menit
  • Durasi video maksimum (tanpa audio): Sekitar 1 jam
  • Jumlah maksimum video per perintah: 10
  • Token resolusi default per frame: 70
  • Jenis MIME yang didukung:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durasi audio maksimum per perintah: Sekitar 8,4 jam, atau hingga 1 juta token
  • Jumlah maksimum file audio per perintah: 1
  • Pemahaman ucapan untuk: Ringkasan, transkripsi, dan terjemahan audio
  • Jenis MIME yang didukung:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Default parameter
  • Suhu: 0,0-2,0 (default 1,0)
  • topP: 0,0-1,0 (default 0,95)
  • topK: 64 (tetap)
  • candidateCount: 1–8 (default 1)
Region yang didukung

Ketersediaan model

(Mencakup Standard PayGo & Throughput yang Disediakan)

  • Global
    • global
Lihat Deployment dan endpoint untuk mengetahui informasi selengkapnya.
Tanggal batas informasi Januari 2025
Versi
  • gemini-3-flash-preview
    • Tahap peluncuran: Pratinjau publik
    • Tanggal rilis: 17 Desember 2025
Kontrol keamanan
Prediksi online
  • Residensi data
  • CMEK
  • VPC-SC
  • AXT
Prediksi batch
  • Residensi data
  • CMEK
  • VPC-SC
  • AXT
Penyesuaian
  • Residensi data
  • CMEK
  • VPC-SC
  • AXT
Penyimpanan cache konteks
  • Residensi data
  • CMEK
  • VPC-SC
  • AXT
Lihat Kontrol keamanan untuk mengetahui informasi selengkapnya.
Bahasa yang didukung Lihat Bahasa yang didukung.
Harga Lihat Harga.