Gemini 3 Flash

Anteprima

Questo prodotto o funzionalità è soggetto ai "Termini delle Offerte pre-GA" nella sezione Termini di servizio generali dei Termini di servizio specificie ai Termini aggiuntivi per i prodotti in anteprima dell'AI generativa. Puoi trattare i dati personali per questo prodotto o funzionalità come indicato nell'Addendum per il trattamento dei dati Cloud, fatti salvi gli obblighi e le restrizioni all'interno dell'accordo che regola l'accesso a Google Cloud. I prodotti e le funzionalità pre-GA sono disponibili "così come sono" e potrebbero avere un supporto limitato. Per ulteriori informazioni, consulta le descrizioni delle fasi di lancio.

Gemini 3 Flash combina le capacità di ragionamento di Gemini 3 Pro con i livelli di latenza, efficienza e costi della linea Flash. Non solo consente di svolgere le attività quotidiane con un ragionamento migliorato, ma è progettato per affrontare i workflow agentici più complessi.

Gemini 3 Flash utilizza diverse nuove funzionalità per migliorare le prestazioni, il controllo e la fedeltà multimodale:

Livello di pensiero: utilizza il parametro thinking_level per controllare la quantità di ragionamento interno eseguito dal modello (minimo, basso, medio o alto) per bilanciare la qualità della risposta, la complessità del ragionamento, la latenza e il costo. Il parametro thinking_level sostituisce thinking_budget per i modelli Gemini 3.

Nota: se hai utilizzato un budget di ragionamento di 0 con Gemini 2.5 Flash, imposta il livello di ragionamento su MINIMAL per ottenere latenza e costi simili; tuttavia, devi comunque gestire le firme del pensiero quando utilizzi il livello di ragionamento minimo.

Per informazioni dettagliate sui diversi livelli di pensiero, vedi Pensiero.
Firme del pensiero: la convalida più rigorosa delle firme del pensiero migliora l'affidabilità delle chiamate di funzioni multi-turno.
Risoluzione dei contenuti multimediali: utilizza il parametro media_resolution (bassa, media, alta o molto alta) per controllare l'elaborazione della visione per gli input multimodali, influendo sull'utilizzo dei token e sulla latenza. Consulta Guida introduttiva a Gemini 3 per le impostazioni di risoluzione predefinite.
- Il livello di risoluzione dei contenuti multimediali ultra alta è disponibile solo per la modalità IMAGE.
- I conteggi dei token PDF saranno elencati nella modalità IMAGE anziché nella modalità DOCUMENT in usage_metadata.
Risposte delle funzioni multimodali: le risposte delle funzioni ora possono includere oggetti multimodali come immagini e PDF, oltre al testo.
Chiamata di funzioni in streaming: trasmetti in streaming gli argomenti parziali della chiamata di funzioni per migliorare l'esperienza utente durante l'utilizzo degli strumenti.

Per saperne di più sull'utilizzo di queste funzionalità, consulta la guida introduttiva all'utilizzo di Gemini 3.

Prova in Vertex AI Visualizza in Model Garden (anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con fatturazione e API Vertex AI abilitate.

Specifiche tecniche
ID modello	`gemini-3-flash-preview`
Input e output supportati	Input: Testo, Codice, Immagini, Audio, Video, PDF Output: Testo
Limiti di token	Token di input massimi: 1.048.576 Numero massimo di token di output: 65.536
Funzionalità	Supportato Grounding con la Ricerca Google Esecuzione del codice Istruzioni di sistema Output strutturato Chiamata di funzione Conteggio token Pensando Memorizzazione nella cache del contesto implicito Memorizzazione nella cache del contesto esplicito Vertex AI RAG Engine Completamenti della chat Non supportata API Gemini Live
Opzioni di consumo	Supportato Throughput riservato Standard PayGo Flex PayGo Priority PayGo Previsione batch Non supportata
Opzioni di consumo	Per saperne di più, consulta Opzioni di consumo.
	Immagini	Numero massimo di immagini per prompt: 900 Dimensioni massime del file per i dati in linea o i caricamenti diretti tramite la console: 7 MB Dimensione massima del file per file da Google Cloud Storage: 30 MB Token di risoluzione predefiniti: 1120 Tipi MIME supportati: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Documenti	Numero massimo di file per prompt: 900 Numero massimo di pagine per file: 900 Dimensione massima del file per importazioni API o Cloud Storage: 50 MB Dimensioni massime del file per i caricamenti diretti tramite la console: 7 MB Token di risoluzione predefiniti: 560 OCR per i PDF scansionati: Non utilizzato per impostazione predefinita Tipi MIME supportati: `application/pdf`, `text/plain`
	Video	Durata massima del video (con audio): Circa 45 minuti Durata massima del video (senza audio): Circa 1 ora Numero massimo di video per prompt: 10 Token di risoluzione predefiniti per fotogramma: 70 Tipi MIME supportati: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Durata massima dell'audio per prompt: Circa 8, 4 ore o fino a 1 milione di token Numero massimo di file audio per prompt: 1 Comprensione del parlato per: Riepilogo, trascrizione e traduzione dell'audio Tipi MIME supportati: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valori predefiniti dei parametri	Temperatura: 0.0-2.0 (valore predefinito 1.0) topP: 0.0-1.0 (valore predefinito 0.95) topK: 64 (fisso) candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate
	Disponibilità del modello	Globale globale
	Per ulteriori informazioni, consulta Deployment ed endpoint.
Data del knowledge cutoff	Gennaio 2025
Versioni	`gemini-3-flash-preview` Fase di lancio: anteprima pubblica Data di rilascio: 17 dicembre 2025
Lingue supportate	Consulta la sezione Lingue supportate.
Prezzi	Vedi Prezzi.

Gemini 3 Flash Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Gemini 3 Flash