Modelli Google

Modelli Gemini in primo piano

Modelli Gemini disponibili a livello generale

diamond Gemini 2.5 Pro Il nostro modello ad alta capacità per ragionamenti e programmazione complessi. Offre funzionalità di pensiero adattivo per risolvere sfide agentiche e multimodali complesse con un contesto di 1 milione di token.
spark Gemini 2.5 Flash Veloce e altamente efficiente. Offre un equilibrio tra intelligenza e latenza con budget di pensiero controllabili per applicazioni versatili.
🍌 Gemini 2.5 Flash Image Trasforma le idee in asset pronti per la produzione. Offre editing conversazionale, fusione di più immagini e coerenza dei personaggi per flussi di lavoro creativi avanzati.
performance_auto Gemini 2.5 Flash-Lite Progettato per una scalabilità elevata. Bilancia costi e prestazioni per attività a elevata velocità effettiva, ottimizzato per l'efficienza senza sacrificare la comprensione multimodale.
audio_spark Gemini 2.5 Flash con API Gemini Live Progettato per lo streaming bidirezionale in tempo reale. Offre funzionalità audio e di dialogo affettivo integrate a bassa latenza per interazioni conversazionali naturali.
spark Gemini 2.0 Flash Prestazioni multimodali per gli sviluppatori che hanno bisogno di un modello conveniente per attività per uso generico.
performance_auto Gemini 2.0 Flash-Lite Semplificato e ultra efficiente per attività semplici e ad alta frequenza in cui la velocità e il prezzo sono la priorità.

Modelli Gemini in anteprima

anteprima Gemini 3.1 Flash-Lite Il nostro modello più conveniente, ottimizzato per i casi d'uso a bassa latenza per il traffico LLM ad alto volume e sensibile ai costi.
anteprima Gemini 3.1 Flash Image Trasforma le idee in asset pronti per la produzione. Offre editing conversazionale, fusione di più immagini e coerenza dei personaggi per flussi di lavoro creativi avanzati.
anteprima Gemini 3.1 Pro Il nostro modello più recente basato sul ragionamento, ottimizzato per flussi di lavoro agentici e programmazione complessi. Offre pensiero adattivo, una finestra contestuale da 1 milione di token e grounding integrato per la risoluzione di problemi multimodali sofisticati.
anteprima Gemini 3 Flash Il nostro modello migliore per la comprensione multimodale complessa, progettato per affrontare i problemi agentici più difficili con funzionalità di programmazione avanzate e di ragionamento all'avanguardia.
anteprima Gemini 3 Pro Image Generazione di immagini ad alta fedeltà con composizione migliorata dal ragionamento. Supporta il rendering di testo leggibile, l'editing multi-turno complesso e la coerenza dei personaggi utilizzando fino a 14 input di riferimento.

Modelli Gemma

Gemma 3n Un modello open progettato per un'esecuzione efficiente su dispositivi con poche risorse, che supporta l'input multimodale (testo, immagine, video e audio) e l'output di testo in oltre 140 lingue.
Gemma 3 Un modello open con input di testo e immagini, supporto per oltre 140 lingue e una finestra contestuale di 128.000 token.
Gemma 2 Un modello open che supporta la generazione, il riepilogo e l'estrazione di testo.
Gemma Un modello open piccolo e leggero che supporta la generazione, il riepilogo e l'estrazione di testo.
ShieldGemma 2 Modelli ottimizzati per le istruzioni per valutare la sicurezza di testo e immagini in base a policy definite.
PaliGemma Un modello open di visione-linguaggio che combina SigLIP e Gemma.
CodeGemma Un modello open potente e leggero per attività di programmazione, tra cui il completamento, la generazione e la comprensione del codice.
TxGemma Un modello che genera previsioni, classificazioni o testo in base a dati correlati alla terapia, per creare modelli di AI con meno dati e calcoli.
MedGemma Una raccolta di varianti di Gemma 3 addestrate per le prestazioni nella comprensione di testo e immagini mediche.
MedSigLIP Una variante di SigLIP addestrata per codificare immagini e testo medici in uno spazio di embedding comune.
T5Gemma Una famiglia di modelli di ricerca encoder-decoder leggeri.

Modelli di embedding

width_normal Embedding per il testo Converte i dati di testo in rappresentazioni vettoriali per la ricerca semantica, la classificazione e il clustering.
width_normal Embedding multimodali Genera vettori basati su immagini, per attività come la classificazione e la ricerca di immagini.

Modelli Veo

movie Veo 2 Generate Genera video da prompt di testo e immagini.
movie Veo 3 Generate Genera video da prompt di testo e immagini di alta qualità.
film Veo 3 Fast Genera video da prompt di testo e immagini di alta qualità e a bassa latenza.
movie Veo 3.1 Generate Genera video da prompt di testo e immagini di alta qualità.
movie Veo 3.1 Fast Genera video da prompt di testo e immagini di alta qualità e a bassa latenza.

Modelli Veo in anteprima

movie Veo 3 Generate preview Genera video da prompt di testo e immagini di alta qualità.
movie Veo 3 Fast preview Genera video da prompt di testo e immagini di alta qualità e a bassa latenza.
movie Veo 3.1 Generate preview Genera video da prompt di testo e immagini di alta qualità.
movie Veo 3.1 Fast preview Genera video da prompt di testo e immagini di alta qualità e a bassa latenza.
movie Veo 2 Preview Genera video da prompt di testo e immagini, supportando inpaint e outpaint.

Modelli Veo sperimentali

movie Veo 2 Experimental Un modello sperimentale con funzionalità in fase di test.

Modelli Lyria

music_note_spark Lyria 3 Pro (anteprima) Genera brani musicali completi da prompt di testo e immagini.
music_note_spark Lyria 3 Clip (anteprima) Genera clip audio di 30 secondi da prompt di testo e immagini.
audio_spark Lyria 2 Genera musica da prompt di testo.

Supporto dei linguaggi

Gemini

Tutti i modelli Gemini possono comprendere e rispondere nelle seguenti lingue:

Afrikaans (af), albanese (sq), amarico (am), arabo (ar), armeno (hy), assamese (as), azero (az), basco (eu), bielorusso (be), bengalese (bn), bosniaco (bs), bulgaro (bg), catalano (ca), cebuano (ceb), cinese (semplificato e tradizionale) (zh), corso (co), croato (hr), ceco (cs), danese (da), divehi (dv), olandese (nl), inglese (en), esperanto (eo), estone (et), filippino (tagalog) (fil), finlandese (fi), francese (fr), frisone (fy), galiziano (gl), georgiano (ka), tedesco (de), greco (el), gujarati (gu), creolo haitiano (ht), hausa (ha), hawaiano (haw), ebraico (iw), hindi (hi), hmong (hmn), ungherese (hu), islandese (is), igbo (ig), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), giavanese (jv), kannada (kn), kazako (kk), khmer (km), coreano (ko), krio (kri), curdo (ku), kirghiso (ky), lao (lo), latino (la), lettone (lv), lituano (lt), lussemburghese (lb), macedone (mk), malgascio (mg), malese (ms), malayalam (ml), maltese (mt), maori (mi), marathi (mr), meiteilon (manipuri) (mni-Mtei), mongolo (mn), birmano (my), nepalese (ne), norvegese (no), nyanja (chichewa) (ny), odia (oriya) (or), pashto (ps), persiano (fa), polacco (pl), portoghese (pt), punjabi (pa), rumeno (ro), russo (ru), samoano (sm), gaelico scozzese (gd), serbo (sr), sesotho (st), shona (sn), sindhi (sd), singalese (si), slovacco (sk), sloveno (sl), somalo (so), spagnolo (es), sundanese (su), swahili (sw), svedese (sv), tagico (tg), tamil (ta), telugu (te), tailandese (th), turco (tr), ucraino (uk), urdu (ur), uiguro (ug), uzbeko (uz), vietnamita (vi), gallese (cy), xhosa (xh), yiddish (yi), yoruba (yo) e zulu (zu).

Gemma

Gemma e Gemma 2 supportano solo la lingua inglese (en). Gemma 3 e Gemma 3n forniscono supporto multilingue in oltre 140 lingue.

Embedding

I modelli di text embedding multilingue supportano le seguenti lingue:

Afrikaans (af), albanese (sq), amarico (am), arabo (ar), armeno (hy), azero (az), basco (eu), bielorusso (be), bengalese (bn), bulgaro (bg), catalano (ca), cebuano (ceb), cinese (semplificato e tradizionale) (zh), corso (co), ceco (cs), danese (da), olandese (nl), inglese (en), esperanto (eo), estone (et), filippino (tagalog) (fil), finlandese (fi), francese (fr), frisone (fy), galiziano (gl), georgiano (ka), tedesco (de), greco (el), gujarati (gu), creolo haitiano (ht), hausa (ha), hawaiano (haw), ebraico (iw), hindi (hi), hmong (hmn), ungherese (hu), islandese (is), igbo (ig), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), giavanese (jv), kannada (kn), kazako (kk), khmer (km), coreano (ko), curdo (ku), kirghiso (ky), lao (lo), latino (la), lettone (lv), lituano (lt), lussemburghese (lb), macedone (mk), malgascio (mg), malese (ms), malayalam (ml), maltese (mt), maori (mi), marathi (mr), mongolo (mn), birmano (my), nepalese (ne), nyanja (chichewa) (ny), norvegese (no), pashto (ps), persiano (fa), polacco (pl), portoghese (pt), punjabi (pa), rumeno (ro), russo (ru), samoano (sm), gaelico scozzese (gd), serbo (sr), sesotho (st), shona (sn), sindhi (sd), singalese (si), slovacco (sk), sloveno (sl), somalo (so), spagnolo (es), sundanese (su), swahili (sw), svedese (sv), tagico (tg), tamil (ta), telugu (te), tailandese (th), turco (tr), ucraino (uk), urdu (ur), uzbeko (uz), vietnamita (vi), gallese (cy), xhosa (xh), yiddish (yi), yoruba (yo) e zulu (zu).

Esplora tutti i modelli in Model Garden

Model Garden è una piattaforma che ti aiuta a scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset proprietari di Google e di modelli e asset open source selezionati. Per esplorare i modelli e le API di AI generativa disponibili sulla piattaforma agentica Gemini Enterprise, vai a Model Garden nella Google Cloud console.

Vai a Model Garden

Per saperne di più su Model Garden, inclusi i modelli e le funzionalità disponibili, consulta Esplora i modelli di AI in Model Garden.

Versioni modello

Per visualizzare tutte le versioni del modello, inclusi i modelli legacy e ritirati, consulta Versioni e ciclo di vita del modello.

Passaggi successivi