Gemini 3 Flash

Gemini 3 Flash combina le capacità di ragionamento di Gemini 3 Pro con i livelli di latenza, efficienza e costi della linea Flash. Non solo consente di svolgere le attività quotidiane con un ragionamento migliorato, ma è progettato per affrontare i workflow agentici più complessi.

Gemini 3 Flash utilizza diverse nuove funzionalità per migliorare le prestazioni, il controllo e la fedeltà multimodale:

  • Livello di pensiero: utilizza il parametro thinking_level per controllare la quantità di ragionamento interno eseguito dal modello (minimo, basso, medio o alto) per bilanciare la qualità della risposta, la complessità del ragionamento, la latenza e il costo. Il parametro thinking_level sostituisce thinking_budget per i modelli Gemini 3.

    Per informazioni dettagliate sui diversi livelli di pensiero, vedi Pensiero.

  • Firme del pensiero: una convalida più rigorosa delle firme del pensiero migliora l'affidabilità delle chiamate di funzioni multi-turno.

  • Risoluzione dei contenuti multimediali: utilizza il parametro media_resolution (bassa, media, alta o molto alta) per controllare l'elaborazione della visione per gli input multimodali, influendo sull'utilizzo dei token e sulla latenza. Consulta Guida introduttiva a Gemini 3 per le impostazioni di risoluzione predefinite.

    • Il livello di risoluzione dei contenuti multimediali ultra alta è disponibile solo per la modalità IMAGE.
    • I conteggi dei token PDF saranno elencati nella modalità IMAGE anziché nella modalità DOCUMENT in usage_metadata.
  • Risposte delle funzioni multimodali: le risposte delle funzioni ora possono includere oggetti multimodali come immagini e PDF, oltre al testo.

  • Chiamata di funzioni in streaming: trasmetti in streaming gli argomenti parziali della chiamata di funzioni per migliorare l'esperienza utente durante l'utilizzo degli strumenti.

Per saperne di più sull'utilizzo di queste funzionalità, consulta la guida introduttiva all'utilizzo di Gemini 3.

Prova in Vertex AI Visualizza in Model Garden (Anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con fatturazione e API Vertex AI abilitate.
ID modello gemini-3-flash-preview
Ingressi e uscite supportati
  • Input:
    Testo, Codice, Immagini, Audio, Video, PDF
  • Output:
    Testo
Limiti di token
  • Token di input massimi: 1.048.576
  • Numero massimo di token di output: 65.536
Funzionalità
Tipi di utilizzo
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 900
  • Dimensioni massime del file per i dati in linea o i caricamenti diretti tramite la console: 7 MB
  • Dimensione massima del file per file da Google Cloud Storage: 30 MB
  • Token di risoluzione predefiniti: 1120
  • Tipi MIME supportati:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documenti
  • Numero massimo di file per prompt: 900
  • Numero massimo di pagine per file: 900
  • Dimensione massima del file per importazioni API o Cloud Storage: 50 MB
  • Dimensioni massime del file per i caricamenti diretti tramite la console: 7 MB
  • Token di risoluzione predefiniti: 560
  • OCR per i PDF scansionati: Non utilizzato per impostazione predefinita
  • Tipi MIME supportati:
    application/pdf, text/plain
Video
  • Durata massima del video (con audio): Circa 45 minuti
  • Durata massima del video (senza audio): Circa 1 ora
  • Numero massimo di video per prompt: 10
  • Token di risoluzione predefiniti per fotogramma: 70
  • Tipi MIME supportati:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durata massima dell'audio per prompt: Circa 8, 4 ore o fino a 1 milione di token
  • Numero massimo di file audio per prompt: 1
  • Comprensione vocale per: Riepilogo, trascrizione e traduzione dell'audio
  • Tipi MIME supportati:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0.0-1.0 (valore predefinito 0.95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate

Disponibilità del modello

(include Standard PayGo e Throughput riservato)

  • Globale
    • globale
Per ulteriori informazioni, consulta Deployment ed endpoint.
Data del knowledge cutoff Gennaio 2025
Versioni
  • gemini-3-flash-preview
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 17 dicembre 2025
Controlli di sicurezza
Previsione online
  • Residenza dei dati
  • CMEK
  • VPC-SC
  • AXT
Previsione batch
  • Residenza dei dati
  • CMEK
  • VPC-SC
  • AXT
Ottimizzazione
  • Residenza dei dati
  • CMEK
  • VPC-SC
  • AXT
Memorizzazione nella cache contestuale
  • Residenza dei dati
  • CMEK
  • VPC-SC
  • AXT
Per saperne di più, consulta Controlli di sicurezza.
Lingue supportate Consulta la sezione Lingue supportate.
Prezzi Vedi Prezzi.