Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modelli Google

Modelli Gemini in evidenza

3.6 Flash

Maggiore efficienza e ragionamento pratico, che ti aiutano a creare e iterare con maggiore facilità

Maggiore efficienza dei token
Generazione di codice più affidabile
Ragionamento multimodale più efficace

3.5 Flash-Lite

Il nostro modo rapido ed economico per alimentare le tue applicazioni di tutti i giorni

Ottimizzato per bassa latenza e traffico elevato
Orchestrazione efficiente degli strumenti
Comprensione precisa dei documenti

3.1 Flash Image

Trasformare le idee in asset pronti per la produzione

Generare immagini di alta qualità
In grado di eseguire l'editing conversazionale a turni
In grado di eseguire la fusione di più immagini e garantire la coerenza dei personaggi per workflow creativi avanzati

Modelli Gemini disponibili a livello generale

spark Gemini 3.6 Flash Ottimizzato per flussi di lavoro complessi e multi-step, generazione di codice migliorata e ragionamento multimodale migliorato, il tutto utilizzando meno token.

performance_auto Gemini 3.5 Flash-Lite Crea flussi di lavoro agentici leggeri a velocità massime e costi minimi.

🍌 Gemini 3.1 Flash-Lite Image (Nano Banana 2 Lite) Trasforma le idee in asset pronti per la produzione. Progettato per carichi di lavoro ad alto volume e sensibili alla latenza.

🍌 Gemini 3.1 Flash Image Trasforma le idee in asset pronti per la produzione. Offre l'editing conversazionale, la fusione di più immagini e la coerenza dei personaggi per workflow creativi avanzati.

🍌 Gemini 3 Pro Image Generazione di immagini ad alta fedeltà con composizione migliorata dal ragionamento. Supporta il rendering di testo leggibile, l'editing multi-turno complesso e la coerenza dei caratteri utilizzando fino a 14 input di riferimento.

spark Gemini 3.5 Flash Gemini 3.5 Flash offre un'intelligenza di livello quasi Pro alla velocità e al costo del livello Flash: competenze di programmazione di livello Pro, esecuzione agentica parallela, il tutto allo stesso prezzo di un modello Flash.

performance_auto Gemini 3.1 Flash-Lite Il nostro modello più conveniente, ottimizzato per casi d'uso a bassa latenza per il traffico LLM ad alto volume e sensibile ai costi.

diamond Gemini 2.5 Pro Il nostro modello ad alta capacità per ragionamento e programmazione complessi. Funzionalità di pensiero adattivo per risolvere sfide complesse di agentività e multimodalità con un contesto di 1 milione di token.

spark Gemini 2.5 Flash Velocissimo e altamente efficiente. Offre un equilibrio tra intelligenza e latenza con budget di pensiero controllabili per applicazioni versatili.

🍌 Gemini 2.5 Flash Image Trasforma le idee in asset pronti per la produzione. Offre l'editing conversazionale, la fusione di più immagini e la coerenza dei personaggi per workflow creativi avanzati.

performance_auto Gemini 2.5 Flash-Lite Progettato per una scalabilità massiccia. Bilancia costi e prestazioni per attività a velocità effettiva elevata, ottimizzato per l'efficienza senza sacrificare la comprensione multimodale.

audio_spark Gemini 2.5 Flash con l'API Gemini Live Progettato per lo streaming bidirezionale in tempo reale. Offre funzionalità audio e di dialogo affettivo integrate a bassa latenza per interazioni naturali e conversazionali.

Visualizzare l'anteprima dei modelli Gemini

Anteprima Gemini Omni Flash Genera video da testo o risorse di riferimento oppure modifica i video esistenti.

anteprima Gemini 3.1 Flash Image Trasforma le idee in asset pronti per la produzione. Offre l'editing conversazionale, la fusione di più immagini e la coerenza dei personaggi per workflow creativi avanzati.

anteprima Gemini 3.1 Pro Il nostro ultimo modello basato sul ragionamento, ottimizzato per workflow agentici complessi e programmazione. È dotato di pensiero adattivo, una finestra contestuale da 1 milione di token e grounding integrato per la risoluzione di problemi multimodali sofisticati.

anteprima Gemini 3 Flash Il nostro modello migliore per la comprensione multimodale complessa, progettato per affrontare i problemi agentici più difficili con solide capacità di programmazione e ragionamento allo stato dell'arte.

anteprima Gemini 3 Pro Image Generazione di immagini ad alta fedeltà con composizione basata sul ragionamento. Supporta il rendering di testo leggibile, l'editing multi-turno complesso e la coerenza dei caratteri utilizzando fino a 14 input di riferimento.

Modelli Gemma

Gemma 4 Un modello aperto adatto ad attività come la generazione di testo, la programmazione e il ragionamento, che supporta l'input multimodale (testo e immagine per tutte le varianti e audio per le varianti E2B ed E4B).

Gemma 3n Un modello aperto progettato per l'esecuzione efficiente su dispositivi con poche risorse, che supporta l'input multimodale (testo, immagini, video e audio) e l'output di testo in oltre 140 lingue.

Gemma 3 Un modello aperto che supporta l'input di testo e immagini, oltre 140 lingue e una finestra contestuale di 128.000 token.

Gemma 2 Un modello aperto che supporta la generazione, il riepilogo e l'estrazione di testo.

Gemma Un modello aperto piccolo e leggero che supporta la generazione, il riepilogo e l'estrazione di testo.

ShieldGemma 2 Modelli ottimizzati per le istruzioni per valutare la sicurezza di testo e immagini in base a norme definite.

PaliGemma Un modello open vision-language che combina SigLIP e Gemma.

CodeGemma Un modello aperto potente e leggero per attività di programmazione, tra cui completamento, generazione e comprensione del codice.

TxGemma Un modello che genera previsioni, classificazioni o testo in base a dati correlati alla terapia, per creare modelli di AI con meno dati e calcoli.

MedGemma Una raccolta di varianti di Gemma 3 addestrate per le prestazioni nella comprensione di testi e immagini mediche.

MedSigLIP Una variante di SigLIP addestrata per codificare immagini e testo medici in uno spazio di incorporamento comune.

T5Gemma Una famiglia di modelli di ricerca encoder-decoder leggeri.

Modelli di embedding

width_normal Embeddings for Text Converte i dati di testo in rappresentazioni vettoriali per la ricerca semantica, la classificazione e il clustering.

width_normal Incorporamenti multimodali Genera vettori basati su immagini per attività come la classificazione e la ricerca di immagini.

Modelli Veo

Film Veo 2 Generate Genera video da prompt di testo e immagini.

film Veo 3 Generate Genera video da prompt di testo e immagini di alta qualità.

movie Veo 3 Fast Genera video da prompt di testo e immagini con alta qualità e bassa latenza.

film Veo 3.1 Generate Genera video di alta qualità da prompt di testo e immagini.

movie Veo 3.1 Fast Genera video da prompt di testo e immagini con alta qualità e bassa latenza.

Visualizzare l'anteprima dei modelli Veo

movie Anteprima di Veo 3.1 Lite Genera video da prompt di testo e immagini con alta qualità e costi contenuti.

Modelli Lyria

music_note_spark Lyria 3 Pro (anteprima) Genera tracce musicali complete a partire da prompt di testo e immagini.

music_note_spark Clip di Lyria 3 (anteprima) Genera clip audio di 30 secondi da prompt di testo e immagini.

audio_spark Lyria 2 Genera musica da prompt di testo.

Supporto dei linguaggi

Gemini

Tutti i modelli Gemini possono comprendere e rispondere nelle seguenti lingue:

Afrikaans (af), albanese (sq), amarico (am), arabo (ar), armeno (hy), assamese (as), azerbaigiano (az), basco (eu), bielorusso (be), bengalese (bn), bosniaco (bs), bulgaro (bg), catalano (ca), cebuano (ceb), cinese (semplificato e tradizionale) (zh), corso (co), croato (hr), ceco (cs), danese (da), dhivehi (dv), olandese (nl), inglese (en), esperanto (eo), estone (et), filippino (tagalog) (fil), finlandese (fi), francese (fr), frisone (fy), galiziano (gl), georgiano (ka), tedesco (de), greco (el), gujarati (gu), creolo haitiano (ht), hausa (ha), hawaiano (haw), ebraico (iw), hindi (hi), hmong (hmn), ungherese (hu), islandese (is), igbo (ig), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), giavanese (jv), kannada (kn), kazako (kk), khmer (km), coreano (ko), krio (kri), curdo (ku), kirghiso (ky), laotiano (lo), latino (la), lettone (lv), lituano (lt), lussemburghese (lb), macedone (mk), malgascio (mg), malese (ms), malayalam (ml), maltese (mt), maori (mi), marathi (mr), meiteilon (manipuri) (mni-Mtei), mongolo (mn), myanmar (birmano) (my), nepalese (ne), norvegese (no), nyanja (chichewa) (ny), odia (oriya) (or), pashtu (ps), persiano (fa), polacco (pl), portoghese (pt), punjabi (pa), rumeno (ro), russo (ru), samoano (sm), gaelico scozzese (gd), serbo (sr), sesotho (st), shona (sn), sindhi (sd), singalese (si), slovacco (sk), sloveno (sl), somalo (so), spagnolo (es), sundanese (su), swahili (sw), svedese (sv), tagiko (tg), tamil (ta), telugu (te), thailandese (th), turco (tr), ucraino (uk), urdu (ur), uiguro (ug), uzbeko (uz), vietnamita (vi), gallese (cy), xhosa (xh), yiddish (yi), yoruba (yo), e zulu (zu).

Gemma

Gemma e Gemma 2 supportano solo la lingua inglese (en). Gemma 3 e Gemma 3n forniscono supporto multilingue in oltre 140 lingue.

Incorporamenti

I modelli di text embedding multilingue supportano le seguenti lingue:

afrikaans (af), albanese (sq), amarico (am), arabo (ar), armeno (hy), azero (az), basco (eu), bielorusso (be), bengalese (bn), bulgaro (bg), catalano (ca), cebuano (ceb), cinese (semplificato e tradizionale) (zh), corso (co), ceco (cs), danese (da), olandese (nl), inglese (en), esperanto (eo), estone (et), filippino (tagalog) (fil), finlandese (fi), francese (fr), frisone (fy), galiziano (gl), georgiano (ka), tedesco (de), greco (el), gujarati (gu), creolo haitiano (ht), hausa (ha), hawaiano (haw), ebraico (iw), hindi (hi), hmong (hmn), ungherese (hu), islandese (is), igbo (ig), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), giavanese (jv), kannada (kn), kazako (kk), khmer (km), coreano (ko), curdo (ku), kirghiso (ky), laotiano (lo), latino (la), lettone (lv), lituano (lt), lussemburghese (lb), macedone (mk), malgascio (mg), malese (ms), malayalam (ml), maltese (mt), maori (mi), marathi (mr), mongolo (mn), myanmar (birmano) (my), nepalese (ne), nyanja (chichewa) (ny), norvegese (no), pashtu (ps), persiano (fa), polacco (pl), portoghese (pt), punjabi (pa), rumeno (ro), russo (ru), samoano (sm), scozzese (gd), serbo (sr), sesotho (st), shona (sn), sindhi (sd), singalese (si), slovacco (sk), sloveno (sl), somalo (so), spagnolo (es), sundanese (su), swahili (sw), svedese (sv), tagiko (tg), tamil (ta), telugu (te), thailandese (th), turco (tr), ucraino (uk), urdu (ur), uzbeko (uz), vietnamita (vi), gallese (cy), xhosa (xh), yiddish (yi), yoruba (yo), e zulu (zu).

Esplora tutti i modelli in Model Garden

Model Garden è una piattaforma che ti aiuta a scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset proprietari di Google e OSS selezionati. Per esplorare i modelli di AI generativa e le API disponibili su Gemini Enterprise Agent Platform, vai a Model Garden nella console Google Cloud .

Vai a Model Garden

Per saperne di più su Model Garden, inclusi i modelli e le funzionalità disponibili, consulta Esplora i modelli di AI in Model Garden.

Versioni modello

Per visualizzare tutte le versioni del modello, inclusi i modelli legacy e ritirati, consulta Versioni e ciclo di vita del modello.

Modelli Google Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.