Modelli Google

Modelli Gemini in evidenza

Modelli Gemini disponibili a livello generale

diamond Gemini 2.5 Pro Il nostro modello ad alta capacità per ragionamento e programmazione complessi. Funzionalità di pensiero adattivo per risolvere sfide complesse di agenti e multimodali con un contesto di 1 milione di token.
spark Gemini 2.5 Flash Velocissimo e altamente efficiente. Offre un equilibrio tra intelligenza e latenza con budget di pensiero controllabili per applicazioni versatili.
🍌 Gemini 2.5 Flash Image Trasforma le idee in asset pronti per la produzione. Offre editing conversazionale, fusione di più immagini e coerenza dei personaggi per workflow creativi avanzati.
performance_auto Gemini 2.5 Flash-Lite Progettato per una scalabilità massiccia. Bilancia costi e prestazioni per attività ad alta velocità effettiva, ottimizzato per l'efficienza senza sacrificare la comprensione multimodale.
spark Gemini 2.0 Flash Prestazioni multimodali per gli sviluppatori che hanno bisogno di un modello conveniente per attività generiche.
performance_auto Gemini 2.0 Flash-Lite Semplificato e ultra efficiente per attività semplici e ad alta frequenza in cui la velocità e il prezzo sono la priorità.

Visualizzare l'anteprima dei modelli Gemini

anteprima Gemini 3 Pro Il nostro ultimo modello basato sul ragionamento, ottimizzato per flussi di lavoro agentici complessi e programmazione. È dotato di pensiero adattivo, una finestra contestuale da 1 milione di token e grounding integrato per la risoluzione di problemi multimodali sofisticati.
anteprima Gemini 3 Pro Image Generazione di immagini ad alta fedeltà con composizione migliorata dal ragionamento. Supporta il rendering di testo leggibile, la modifica complessa multi-turno e la coerenza dei personaggi utilizzando fino a 14 input di riferimento.
anteprima API Gemini 2.5 Flash Live Progettata per lo streaming bidirezionale in tempo reale. Offre audio integrato a bassa latenza e funzionalità di dialogo affettivo per interazioni naturali e conversazionali.

Modelli Gemma

Gemma 3n Un modello aperto progettato per l'esecuzione efficiente su dispositivi con poche risorse, che supporta input multimodali (testo, immagini, video e audio) e output di testo in oltre 140 lingue.
Gemma 3 Un modello aperto che supporta l'input di testo e immagini, oltre 140 lingue e una finestra contestuale da 128.000 token.
Gemma 2 Un modello aperto che supporta la generazione, il riepilogo e l'estrazione di testo.
Gemma Un modello aperto piccolo e leggero che supporta la generazione, il riepilogo e l'estrazione di testo.
ShieldGemma 2 Modelli ottimizzati per le istruzioni per valutare la sicurezza di testo e immagini in base a norme definite.
PaliGemma Un modello open vision-language che combina SigLIP e Gemma.
CodeGemma Un modello aperto potente e leggero per attività di programmazione, tra cui completamento, generazione e comprensione del codice.
TxGemma Un modello che genera previsioni, classificazioni o testo in base a dati correlati alla terapia, per creare modelli di AI con meno dati e calcoli.
MedGemma Una raccolta di varianti di Gemma 3 addestrate per le prestazioni nella comprensione di testi e immagini mediche.
MedSigLIP Una variante di SigLIP addestrata per codificare immagini e testo medici in uno spazio di embedding comune.
T5Gemma Una famiglia di modelli di ricerca encoder-decoder leggeri.

Modelli di embedding

width_normal Embeddings for Text Converte i dati di testo in rappresentazioni vettoriali per la ricerca semantica, la classificazione e il clustering.
width_normal Embedding multimodali Genera vettori basati su immagini per attività come la classificazione e la ricerca di immagini.

Modelli Imagen

photo_spark Imagen 4 per la generazione Usa prompt di testo per generare nuove immagini con una qualità superiore rispetto ai nostri precedenti modelli di generazione di immagini
photo_spark Imagen 4 per la generazione rapida Usa prompt di testo per generare nuove immagini con una qualità superiore e una latenza inferiore rispetto ai nostri precedenti modelli di generazione di immagini
photo_spark Imagen 4 per la generazione Ultra Usa prompt di testo per generare nuove immagini con una qualità superiore e una migliore aderenza ai prompt rispetto ai nostri precedenti modelli di generazione di immagini
photo_spark Imagen 3 per la generazione 002 Usa prompt di testo per generare nuove immagini
photo_spark Imagen 3 per la generazione 001 Usa prompt di testo per generare nuove immagini
photo_spark Imagen 3 per la generazione rapida Usa prompt di testo per generare nuove immagini con una latenza inferiore rispetto agli altri nostri modelli di generazione di immagini
image_edit_auto Imagen 3 per la modifica e la personalizzazione Modifica le immagini esistenti o genera nuove immagini in base ai prompt di testo e al contesto fornito.

Visualizzare l'anteprima dei modelli Imagen

photo_spark Prova virtuale Genera immagini di persone che indossano prodotti di abbigliamento.
image_edit_auto Riconfigurazione del prodotto Imagen su Vertex AI Modifica le immagini dei prodotti per inserirle in scene o sfondi diversi in base ai prompt di testo.

Modelli Veo

film Veo 2 Generate Genera video da prompt di testo e immagini.
film Veo 3 Generate Genera video di alta qualità da prompt di testo e immagini.
film Veo 3 Fast Genera video da prompt di testo e immagini con alta qualità e bassa latenza.
film Veo 3.1 Generate Genera video di alta qualità da prompt di testo e immagini.
movie Veo 3.1 Fast Genera video da prompt di testo e immagini con alta qualità e bassa latenza.

Visualizzare l'anteprima dei modelli Veo

Film Veo 3 Genera anteprima Genera video da prompt di testo e immagini di alta qualità.
film Anteprima di Veo 3 Fast Genera video da prompt di testo e immagini con alta qualità e bassa latenza.
movie Veo 3.1 Generate preview Genera video di alta qualità da prompt di testo e immagini.
movie Anteprima rapida di Veo 3.1 Genera video da prompt di testo e immagini con alta qualità e bassa latenza.
movie Anteprima di Veo 2 Genera video da prompt di testo e immagini, supportando l'inpainting e l'outpainting.

Modelli Veo sperimentali

movie Veo 2 Experimental Un modello sperimentale con funzionalità in fase di test.

Modelli MedLM

medical_information MedLM-medium Un modello conforme a HIPAA per rispondere a domande mediche e riassumere documenti sanitari.
clinical_notes MedLM-large-large Un modello conforme a HIPAA per rispondere a domande mediche e riassumere documenti sanitari.

Supporto dei linguaggi

Gemini

Tutti i modelli Gemini possono comprendere e rispondere nelle seguenti lingue:

afrikaans (af), albanese (sq), amarico (am), arabo (ar), armeno (hy), assamese (as), azerbaigiano (az), basco (eu), bielorusso (be), bengalese (bn), bosniaco (bs), bulgaro (bg), catalano (ca), cebuano (ceb), cinese (semplificato e tradizionale) (zh), corso (co), croato (hr), ceco (cs), danese (da), dhivehi (dv), olandese (nl), inglese (en), esperanto (eo), estone (et), filippino (tagalog) (fil), finlandese (fi), francese (fr), frisone (fy), galiziano (gl), georgiano (ka), tedesco (de), greco (el), gujarati (gu), creolo haitiano (ht), hausa (ha), hawaiano (haw), ebraico (iw), hindi (hi), hmong (hmn), ungherese (hu), islandese (is), igbo (ig), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), giavanese (jv), kannada (kn), kazako (kk), khmer (km), coreano (ko), krio (kri), curdo (ku), kirghiso (ky), laotiano (lo), latino (la), lettone (lv), lituano (lt), lussemburghese (lb), macedone (mk), malgascio (mg), malese (ms), malayalam (ml), maltese (mt), maori (mi), marathi (mr), meiteilon (manipuri) (mni-Mtei), mongolo (mn), myanmar (birmano) (my), nepalese (ne), norvegese (no), nyanja (chichewa) (ny), odia (oriya) (or), pashto (ps), persiano (fa), polacco (pl), portoghese (pt), punjabi (pa), rumeno (ro), russo (ru), samoano (sm), gaelico scozzese (gd), serbo (sr), sesotho (st), shona (sn), sindhi (sd), singalese (si), slovacco (sk), sloveno (sl), somalo (so), spagnolo (es), sundanese (su), swahili (sw), svedese (sv), tagiko (tg), tamil (ta), telugu (te), thailandese (th), turco (tr), ucraino (uk), urdu (ur), uiguro (ug), uzbeko (uz), vietnamita (vi), gallese (cy), xhosa (xh), yiddish (yi), yoruba (yo), e zulu (zu).

Gemma

Gemma e Gemma 2 supportano solo la lingua inglese (en). Gemma 3 e Gemma 3n forniscono supporto multilingue in oltre 140 lingue.

Incorporamenti

I modelli di text embedding multilingue supportano le seguenti lingue:

Afrikaans (af), albanese (sq), amarico (am), arabo (ar), armeno (hy), azero (az), basco (eu), bielorusso (be), bengalese (bn), bulgaro (bg), catalano (ca), cebuano (ceb), cinese (semplificato e tradizionale) (zh), corso (co), ceco (cs), danese (da), olandese (nl), inglese (en), esperanto (eo), estone (et), filippino (tagalog) (fil), finlandese (fi), francese (fr), frisone (fy), galiziano (gl), georgiano (ka), tedesco (de), greco (el), gujarati (gu), creolo haitiano (ht), hausa (ha), hawaiano (haw), ebraico (iw), hindi (hi), hmong (hmn), ungherese (hu), islandese (is), igbo (ig), indonesiano (id), irlandese (ga), italiano (it), giapponese (ja), giavanese (jv), kannada (kn), kazako (kk), khmer (km), coreano (ko), curdo (ku), kirghiso (ky), laotiano (lo), latino (la), lettone (lv), lituano (lt), lussemburghese (lb), macedone (mk), malgascio (mg), malese (ms), malayalam (ml), maltese (mt), maori (mi), marathi (mr), mongolo (mn), myanmar (birmano) (my), nepalese (ne), nyanja (chichewa) (ny), norvegese (no), pashto (ps), persiano (fa), polacco (pl), portoghese (pt), punjabi (pa), rumeno (ro), russo (ru), samoano (sm), gaelico scozzese (gd), serbo (sr), sesotho (st), shona (sn), sindhi (sd), singalese (si), slovacco (sk), sloveno (sl), somalo (so), spagnolo (es), sundanese (su), swahili (sw), svedese (sv), tagiko (tg), tamil (ta), telugu (te), thailandese (th), turco (tr), ucraino (uk), urdu (ur), uzbeko (uz), vietnamita (vi), gallese (cy), xhosa (xh), yiddish (yi), yoruba (yo), e zulu (zu).

Imagen 3

Imagen 3 supporta le seguenti lingue:

Inglese (en), cinese (semplificato e tradizionale) (zh), hindi (hi), giapponese (ja), coreano (ko), portoghese (pt), e spagnolo (es).

MedLM

Il modello MedLM supporta la lingua inglese (en).

Esplora tutti i modelli in Model Garden

Model Garden è una piattaforma che ti aiuta a scoprire, testare, personalizzare ed eseguire il deployment di modelli e asset proprietari di Google e OSS selezionati. Per esplorare i modelli di AI generativa e le API disponibili su Vertex AI, vai a Model Garden nella console Google Cloud .

Vai a Model Garden

Per saperne di più su Model Garden, inclusi i modelli e le funzionalità disponibili, consulta Esplora i modelli di AI in Model Garden.

Versioni modello

Per visualizzare tutte le versioni del modello, inclusi i modelli legacy e ritirati, consulta Versioni e ciclo di vita del modello.

Passaggi successivi