Gemini 3 Flash

Pratinjau

Produk atau fitur ini tunduk pada "Persyaratan Penawaran Pra-GA" di bagian Persyaratan Layanan Umum dari Persyaratan Khusus Layanan, dan Persyaratan Tambahan untuk Produk Pratinjau AI Generatif. Anda dapat memproses data pribadi untuk produk atau fitur ini sebagaimana diuraikan dalam Adendum Pemrosesan Data Cloud, dengan tunduk pada kewajiban dan batasan yang dijelaskan dalam perjanjian yang menjadi dasar Anda mengakses Google Cloud. Produk dan fitur pra-GA tersedia "sebagaimana adanya" dan mungkin memiliki dukungan terbatas. Untuk mengetahui informasi selengkapnya, lihat deskripsi tahap peluncuran.

Gemini 3 Flash menggabungkan kemampuan penalaran Gemini 3 Pro dengan tingkat latensi, efisiensi, dan biaya lini Flash. Model ini tidak hanya memungkinkan tugas sehari-hari dengan penalaran yang lebih baik, tetapi juga dirancang untuk menangani alur kerja agentik yang paling kompleks.

Gemini 3 Flash menggunakan beberapa fitur baru untuk meningkatkan performa, kontrol, dan kualitas multimodal:

Tingkat penalaran: Gunakan parameter thinking_level untuk mengontrol jumlah penalaran internal yang dilakukan model (minimal, rendah, sedang, atau tinggi) untuk menyeimbangkan kualitas respons, kompleksitas penalaran, latensi, dan biaya. Parameter thinking_level menggantikan thinking_budget untuk model Gemini 3.

Catatan: Jika Anda menggunakan anggaran penalaran 0 dengan Gemini 2.5 Flash, tetapkan tingkat penalaran Anda ke MINIMAL untuk latensi dan biaya yang serupa; namun, Anda tetap perlu menangani tanda tangan pemikiran saat menggunakan tingkat penalaran minimal.

Untuk mengetahui detail tentang berbagai tingkat pemikiran, lihat Berpikir.
Tanda tangan pemikiran: Validasi yang lebih ketat terhadap tanda tangan pemikiran meningkatkan keandalan dalam panggilan fungsi multi-giliran.
Resolusi media: Gunakan parameter media_resolution (rendah, sedang, tinggi, atau sangat tinggi) untuk mengontrol pemrosesan penglihatan untuk input multimodal, yang memengaruhi penggunaan token dan latensi. Lihat Mulai menggunakan Gemini 3 untuk setelan resolusi default.
- Tingkat resolusi media sangat tinggi hanya tersedia untuk modalitas IMAGE.
- Jumlah token PDF akan dicantumkan dalam modalitas IMAGE, bukan modalitas DOCUMENT di usage_metadata.
Respons fungsi multimodal: Respons fungsi kini dapat menyertakan objek multimodal seperti gambar dan PDF selain teks.
Panggilan fungsi streaming: Streaming argumen panggilan fungsi parsial untuk meningkatkan pengalaman pengguna selama penggunaan alat.

Untuk mengetahui informasi selengkapnya tentang cara menggunakan fitur ini, lihat Mulai menggunakan Gemini 3.

Coba di Vertex AI Lihat di Model Garden (Pratinjau) Deploy aplikasi contoh

Catatan: Untuk menggunakan fitur "Deploy example app", Anda memerlukan project Google Cloud dengan penagihan dan Vertex AI API yang diaktifkan.

Spesifikasi teknis
ID Model	`gemini-3-flash-preview`
Input & output yang didukung	Input: Teks, Kode, Gambar, Audio, Video, PDF Output: Teks
Batas token	Token input maksimum: 1.048.576 Token output maksimum: 65.536
Kemampuan	Didukung Melakukan grounding dengan Google Penelusuran Eksekusi kode Petunjuk sistem Output terstruktur Panggilan fungsi Menghitung Token Berpikir Penyimpanan konteks implisit dalam cache Explicit context caching Vertex AI RAG Engine Penyelesaian chat Tidak didukung Gemini Live API
Opsi pemakaian	Didukung Throughput yang Disediakan Standard PayGo Flex PayGo Priority PayGo Prediksi batch Tidak didukung
Opsi pemakaian	Lihat Opsi konsumsi untuk mengetahui informasi selengkapnya.
	Gambar	Gambar maksimum per perintah: 900 Ukuran file maksimum per file untuk data inline atau upload langsung melalui konsol: 7 MB Ukuran file maksimum per file dari Google Cloud Storage: 30 MB Token resolusi default: 1120 Jenis MIME yang didukung: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Dokumen	Jumlah maksimum file per perintah: 900 Jumlah maksimum halaman per file: 900 Ukuran file maksimum per file untuk impor API atau Cloud Storage: 50 MB Ukuran file maksimum per file untuk upload langsung melalui konsol: 7 MB Token resolusi default: 560 OCR untuk PDF yang dipindai: Tidak digunakan secara default Jenis MIME yang didukung: `application/pdf`, `text/plain`
	Video	Durasi video maksimum (dengan audio): Sekitar 45 menit Durasi video maksimum (tanpa audio): Sekitar 1 jam Jumlah maksimum video per perintah: 10 Token resolusi default per frame: 70 Jenis MIME yang didukung: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Durasi audio maksimum per perintah: Sekitar 8,4 jam, atau hingga 1 juta token Jumlah maksimum file audio per perintah: 1 Pemahaman ucapan untuk: Ringkasan, transkripsi, dan terjemahan audio Jenis MIME yang didukung: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Default parameter	Suhu: 0,0-2,0 (default 1,0) topP: 0,0-1,0 (default 0,95) topK: 64 (tetap) candidateCount: 1–8 (default 1)
Region yang didukung
	Ketersediaan model	Global global
	Lihat Deployment dan endpoint untuk mengetahui informasi selengkapnya.
Tanggal batas informasi	Januari 2025
Versi	`gemini-3-flash-preview` Tahap peluncuran: Pratinjau publik Tanggal rilis: 17 Desember 2025
Bahasa yang didukung	Lihat Bahasa yang didukung.
Harga	Lihat Harga.

Gemini 3 Flash Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Gemini 3 Flash