Gemini 2.0 Flash

Gemini 2.0 Flash offre funzionalità di nuova generazione e funzionalità migliorate progettate per l'era agentica, tra cui velocità superiore, utilizzo di strumenti integrati, generazione multimodale e una finestra contestuale da 1 milione di token. Gemini 2.0 Flash migliora il nostro modello Flash precedente e offre una qualità superiore a velocità simili.

2.0 Flash

Prova in Vertex AI Visualizza in Model Garden (Anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con fatturazione e API Vertex AI abilitate.
ID modello gemini-2.0-flash
Ingressi e uscite supportati
  • Input:
    Testo, Codice, Immagini, Audio, Video
  • Output:
    Testo
Limiti di token
  • Token di input massimi: 1.048.576
  • Token di output massimi: 8192 (valore predefinito)
Funzionalità
Tipi di utilizzo
Limite di dimensione dell'input 500 MB
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 3000
  • Dimensioni massime dell'immagine: 7 MB
  • Numero massimo di token al minuto (TPM) per progetto:
    • Risoluzione multimediale alta/media/predefinita:
      • Stati Uniti/Asia: 40 M
      • UE: 10 M
    • Risoluzione bassa dei contenuti multimediali:
      • US/Asia: 10 M
      • UE: 2,6 milioni
  • Tipi MIME supportati:
    image/png, image/jpeg, image/webp
Documenti
  • Numero massimo di file per prompt: 3000
  • Numero massimo di pagine per file: 1000
  • Dimensioni massime del file per i file importati tramite API o Cloud Storage: 50 MB
  • Dimensioni massime del file per i caricamenti diretti tramite la console: 7 MB
  • Token massimi al minuto (TPM) per progetto1:
    • US/Asia: 3,4 milioni
    • UE: 3,4 milioni
  • Tipi MIME supportati:
    application/pdf, text/plain
Video
  • Durata massima del video (con audio): Circa 45 minuti
  • Durata massima del video (senza audio): Circa 1 ora
  • Numero massimo di video per prompt: 10
  • Token massimi al minuto (TPM):
    • Risoluzione multimediale alta/media/predefinita:
      • Stati Uniti/Asia: 38 milioni
      • UE: 10 M
    • Risoluzione bassa dei contenuti multimediali:
      • US/Asia: 10 M
      • UE: 2,5 milioni
  • Tipi MIME supportati:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durata audio massima per prompt: Circa 8, 4 ore o fino a 1 milione di token
  • Numero massimo di file audio per prompt: 1
  • Comprensione vocale per: Riepilogo, trascrizione e traduzione dell'audio
  • Token massimi al minuto (TPM):
    • US/Asia: 3,5 M
    • UE: 3,5 milioni
  • Tipi MIME supportati:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0.0-1.0 (valore predefinito 0.95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate

Disponibilità del modello

(Include la quota condivisa dinamica e il throughput riservato)

  • Globale
    • globale
  • Stati Uniti
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Elaborazione ML

  • Stati Uniti
    • Più regioni
  • Europa
    • Più regioni
Per saperne di più, consulta Residenza dei dati.
Data del knowledge cutoff Giugno 2024
Versioni
  • gemini-2.0-flash-001
    • Fase di lancio: disponibilità generale
    • Data di rilascio: 5 febbraio 2025
    • Data di ritiro: 5 febbraio 2026
Controlli di sicurezza
Previsione online
  • Residenza dei dati (at-rest) Supportato
  • Chiavi di crittografia gestite dal cliente (CMEK) Supportato
  • Controlli di servizio VPC Supportati
  • Access Transparency (AXT) Supportato
Previsione batch
  • Residenza dei dati (at-rest) Supportato
  • Chiavi di crittografia gestite dal cliente (CMEK) Non supportate
  • Controlli di servizio VPC Supportati
  • Access Transparency (AXT) Non supportato
Ottimizzazione
  • Residenza dei dati (at-rest) Supportato
  • Chiavi di crittografia gestite dal cliente (CMEK) Supportato
  • Controlli di servizio VPC Supportati
  • Access Transparency (AXT) Non supportato
Per ulteriori informazioni, consulta Controlli di sicurezza.
Lingue supportate Vedi Lingue supportate.
Prezzi Vedi Prezzi.

Generazione di immagini

Prova in Vertex AI

ID modello gemini-2.0-flash-preview-image-generation
Ingressi e uscite supportati
  • Input:
    Testo, Codice, Immagini, Audio, Video
  • Output:
    Testo e immagine
Limiti di token
  • Numero massimo di token di input: 32.768
  • Token di output massimi: 8192 (valore predefinito)
Funzionalità
Tipi di utilizzo
Limite di dimensione dell'input 500 MB
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 3000
  • Dimensioni massime dell'immagine: 7 MB
  • Numero massimo di immagini di output per prompt: 10
  • Numero massimo di token al minuto (TPM) per progetto:
    • Risoluzione multimediale alta/media/predefinita:
      • Stati Uniti/Asia: 40 M
      • UE: 10 M
    • Risoluzione bassa dei contenuti multimediali:
      • US/Asia: 10 M
      • UE: 3 Mln
  • Tipi MIME supportati:
    image/png, image/jpeg, image/webp
Documenti
  • Numero massimo di file per prompt: 3000
  • Numero massimo di pagine per file: 1000
  • Dimensione massima del file per file: 50 MB
  • Tipi MIME supportati:
    application/pdf, text/plain
Video
  • Durata massima del video (con audio): Circa 45 minuti
  • Durata massima del video (senza audio): Circa 1 ora
  • Numero massimo di video per prompt: 10
  • Token massimi al minuto (TPM):
    • Risoluzione multimediale alta/media/predefinita:
      • US/Asia: 37,9 M
      • UE: 9,5 milioni
    • Risoluzione bassa dei contenuti multimediali:
      • Stati Uniti/Asia: 1 G
      • UE: 2,5 milioni
  • Tipi MIME supportati:
Audio
  • Durata audio massima per prompt: Circa 8, 4 ore o fino a 1 milione di token
  • Numero massimo di file audio per prompt: 1
  • Comprensione vocale per: Riepilogo, trascrizione e traduzione dell'audio
  • Token massimi al minuto (TPM):
    • Stati Uniti/Asia: 1,7 milioni
    • UE: 0,4 Mln
  • Tipi MIME supportati:
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0.0-1.0 (valore predefinito 0.95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate

Disponibilità del modello

(Include la quota condivisa dinamica e il throughput riservato)

  • Globale
    • globale
Per saperne di più, consulta Residenza dei dati.
Data del knowledge cutoff Agosto 2024
Versioni
  • gemini-2.0-flash-preview-image-generation
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 6 maggio 2025
    • Data di ritiro: 31 ottobre 2025
Controlli di sicurezza
Previsione online
  • Residenza dei dati (at-rest) Non supportato
  • Chiavi di crittografia gestite dal cliente (CMEK) Non supportate
  • Controlli di servizio VPC Supportati
  • Access Transparency (AXT) Supportato
Per ulteriori informazioni, consulta Controlli di sicurezza.
Lingue supportate Vedi Lingue supportate.
Prezzi Vedi Prezzi.

API Live

Prova in Vertex AI

ID modello gemini-2.0-flash-live-preview-04-09
Ingressi e uscite supportati
  • Input:
    Audio, Video
  • Output:
    Audio
Limiti di token
  • Numero massimo di token di input: 32.768
  • Token di output massimi: 8192 (valore predefinito)
Funzionalità
Tipi di utilizzo
Limite di dimensione dell'input 500 MB
Specifiche tecniche
Video
  • Durata massima del video (con audio): Circa 45 minuti
  • Durata massima del video (senza audio): Circa 1 ora
  • Numero massimo di video per prompt: 10
  • Token massimi al minuto (TPM):
    • Risoluzione multimediale alta/media/predefinita:
      • US/Asia: 37,9 M
      • UE: 9,5 milioni
    • Risoluzione bassa dei contenuti multimediali:
      • Stati Uniti/Asia: 1 G
      • UE: 2,5 milioni
  • Tipi MIME supportati:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durata audio massima per prompt: Circa 8, 4 ore o fino a 1 milione di token
  • Numero massimo di file audio per prompt: 1
  • Comprensione vocale per: Riepilogo, trascrizione e traduzione dell'audio
  • Token massimi al minuto (TPM):
    • Stati Uniti/Asia: 1,7 milioni
    • UE: 0,4 Mln
  • Tipi MIME supportati:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valori predefiniti dei parametri
  • Temperatura: 0.0-2.0 (valore predefinito 1.0)
  • topP: 0.0-1.0 (valore predefinito 0.95)
  • topK: 64 (fisso)
  • candidateCount: 1-8 (valore predefinito 1)
Aree geografiche supportate

Disponibilità del modello

  • Stati Uniti
    • us-central1
Per saperne di più, consulta Residenza dei dati.
Data del knowledge cutoff Giugno 2024
Versioni
  • gemini-2.0-flash-live-preview-04-09
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 9 aprile 2025
Controlli di sicurezza
Previsione online
  • Residenza dei dati (at-rest) Non supportato
  • Chiavi di crittografia gestite dal cliente (CMEK) Non supportate
  • Controlli di servizio VPC Supportati
  • Access Transparency (AXT) Supportato
Per ulteriori informazioni, consulta Controlli di sicurezza.
Lingue supportate Vedi Lingue supportate.
Prezzi Vedi Prezzi.