Modèles Google

Modèles Gemini à la une

Modèles Gemini disponibles

performance_auto Gemini 3.1 Flash-Lite Notre modèle le plus économique, optimisé pour les cas d'utilisation à faible latence pour le trafic LLM élevé et sensible aux coûts.
diamond Gemini 2.5 Pro Notre modèle à haute capacité pour le raisonnement et le codage complexes. Fonctionnalités de réflexion adaptative pour résoudre des défis agentiques et multimodaux complexes avec un contexte de 1 million de jetons.
spark Gemini 2.5 Flash Rapide comme l'éclair et très performant. Équilibre entre intelligence et latence avec des budgets de réflexion contrôlables pour des applications polyvalentes.
🍌 Gemini 2.5 Flash Image Transformez vos idées en éléments prêts pour la production. Retouche conversationnelle, fusion multi-images et cohérence des personnages pour des workflows créatifs avancés.
performance_auto Gemini 2.5 Flash-Lite Conçu pour une mise à l'échelle massive. Équilibre entre coût et performances pour les tâches à haut débit, optimisé pour l'efficacité sans sacrifier la compréhension multimodale.
audio_spark Gemini 2.5 Flash avec l'API Gemini Live Conçu pour le streaming bidirectionnel en temps réel. Fonctionnalités audio intégrées à faible latence et de dialogue affectif pour des interactions naturelles et conversationnelles.
spark Gemini 2.0 Flash Performances multimodales pour les développeurs ayant besoin d'un modèle économique pour les tâches à usage général.
performance_auto Gemini 2.0 Flash-Lite Rationalisé et ultra-efficace pour les tâches simples et à haute fréquence où la vitesse et le prix sont prioritaires.

Modèles Gemini en version preview

preview Gemini 3.1 Flash Image Transformez vos idées en éléments prêts pour la production. Retouche conversationnelle, fusion multi-images et cohérence des personnages pour des workflows créatifs avancés.
preview Gemini 3.1 Pro Notre dernier modèle axé sur le raisonnement, optimisé pour les workflows agentiques et le codage complexes. Fonctionnalités de réflexion adaptative, fenêtre de contexte de 1 million de jetons et ancrage intégré pour une résolution de problèmes multimodaux sophistiquée.
preview Gemini 3 Flash Notre meilleur modèle pour la compréhension multimodale complexe, conçu pour résoudre les problèmes agentiques les plus difficiles grâce à de solides capacités de codage et de raisonnement de pointe.
preview Gemini 3 Pro Image Génération d'images haute fidélité avec une composition améliorée par le raisonnement. Prise en charge du rendu de texte lisible, de la retouche multitour complexe et de la cohérence des personnages à l'aide de 14 entrées de référence au maximum.

Modèles Gemma

Gemma 4 Modèle ouvert adapté aux tâches telles que la génération de texte, le codage et le raisonnement, et prenant en charge l'entrée multimodale (texte et image pour toutes les variantes, et audio en plus pour les variantes E2B et E4B).
Gemma 3n Modèle ouvert conçu pour une exécution efficace sur les appareils à faibles ressources, prenant en charge l'entrée multimodale (texte, image, vidéo et audio) et la sortie de texte dans plus de 140 langues.
Gemma 3 Modèle ouvert avec entrée de texte et d'image, prise en charge de plus de 140 langues et fenêtre de contexte de 128 000 jetons.
Gemma 2 Modèle ouvert prenant en charge la génération, la synthèse et l'extraction de texte.
Gemma Petit modèle ouvert léger prenant en charge la génération, la synthèse et l'extraction de texte.
ShieldGemma 2 Modèles réglés sur les instructions pour évaluer la sécurité du texte et des images par rapport à des règles définies.
PaliGemma Modèle ouvert de vision-langage combinant SigLIP et Gemma.
CodeGemma Modèle ouvert puissant et léger pour les tâches de codage, y compris la complétion, la génération et la compréhension de code.
TxGemma Modèle qui génère des prédictions, des classifications ou du texte en fonction de données liées à la thérapie, pour créer des modèles d'IA avec moins de données et de calcul.
MedGemma Collection de variantes de Gemma 3 entraînées pour des performances sur la compréhension de textes et d'images médicales.
MedSigLIP Variante de SigLIP entraînée pour encoder des images et du texte médicaux dans un espace d'embedding commun.
T5Gemma Famille de modèles de recherche d'encodeur/décodeur légers.

Modèles d'embeddings

width_normal Embeddings pour le texte Convertit les données textuelles en représentations vectorielles pour la recherche sémantique, la classification et le clustering.
width_normal Embeddings multimodaux Génère des vecteurs basés sur des images, pour des tâches telles que la classification et la recherche d'images.

Modèles Veo

movie Veo 2 Generate Génère des vidéos à partir de requêtes textuelles et d'images.
movie Veo 3 Générer Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité.
film Veo 3 Rapide Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité et à faible latence.
movie Veo 3.1 Générer Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité.
film Veo 3.1 Rapide Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité et à faible latence.

Modèles Veo en version preview

movie Veo 3.1 Lite preview Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité et à faible coût.
movie Veo 3 Générer preview Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité.
movie Veo 3 Fast preview Génère des vidéos à partir de prompts textuels et d'images de haute qualité et à faible latence.
movie Veo 3.1 Générer preview Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité.
movie Veo 3.1 Rapide preview Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité et à faible latence.
movie Veo 2 Preview Génère des vidéos à partir de requêtes textuelles et d'images, avec prise en charge de la retouche et de la retouche externe.

Modèles Veo expérimentaux

film Veo 2 Expérimental Modèle expérimental avec des fonctionnalités en cours de test.

Modèles Lyria

music_note_spark Lyria 3 Pro (preview) Génère des pistes musicales complètes à partir de requêtes textuelles et d'images.
music_note_spark Lyria 3 Clip (preview) Génère des clips audio de 30 secondes à partir de requêtes textuelles et d'images.
audio_spark Lyria 2 Génère de la musique à partir de requêtes textuelles.

Langues acceptées

Gemini

Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes :

Afrikaans (af), albanais (sq), amharique (am), arabe (ar), arménien (hy), assamais (as), azerbaïdjanais (az), basque (eu), biélorusse (be), bengali (bn), bosnien (bs), bulgare (bg), catalan (ca), cebuano (ceb), chinois (simplifié et traditionnel) (zh), corse (co), croate (hr), tchèque (cs), danois (da), divehi (dv), néerlandais (nl), anglais (en), espéranto (eo), estonien (et), philippin (tagalog) (fil), finnois (fi), français (fr), frison (fy), galicien (gl), géorgien (ka), allemand (de), grec (el), gujarati (gu), créole haïtien (ht), haoussa (ha), hawaïen (haw), hébreu (iw), hindi (hi), hmong (hmn), hongrois (hu), islandais (is), igbo (ig), indonésien (id), irlandais (ga), italien (it), japonais (ja), javanais (jv), kannada (kn), kazakh (kk), khmer (km), coréen (ko), krio (kri), kurde (ku), kirghize (ky), lao (lo), latin (la), letton (lv), lituanien (lt), luxembourgeois (lb), macédonien (mk), malgache (mg), malais (ms), malayalam (ml), maltais (mt), maori (mi), marathi (mr), meitei (manipuri) (mni-Mtei), mongol (mn), birman (my), népalais (ne), norvégien (no), nyanja (chichewa) (ny), odia (oriya) (or), pachtou (ps), persan (fa), polonais (pl), portugais (pt), pendjabi (pa), roumain (ro), russe (ru), samoan (sm), gaélique écossais (gd), serbe (sr), sesotho (st), shona (sn), sindhi (sd), cingalais (si), slovaque (sk), slovène (sl), somali (so), espagnol (es), soundanais (su), swahili (sw), suédois (sv), tadjik (tg), tamoul (ta), télougou (te), thaï (th), turc (tr), ukrainien (uk), ourdou (ur), ouïghour (ug), ouzbek (uz), vietnamien (vi), gallois (cy), xhosa (xh), yiddish (yi), yoruba (yo) et zoulou (zu).

Gemma

Gemma et Gemma 2 ne sont compatibles qu'avec l'anglais (en). Gemma 3 et Gemma 3n sont compatibles avec plus de 140 langues.

Embeddings

Les modèles d'embedding textuel multilingues sont compatibles avec les langues suivantes :

Afrikaans (af), albanais (sq), amharique (am), arabe (ar), arménien (hy), azerbaïdjanais (az), basque (eu), biélorusse (be), bengali (bn), bulgare (bg), catalan (ca), cebuano (ceb), chinois (simplifié et traditionnel) (zh), corse (co), tchèque (cs), danois (da), néerlandais (nl), anglais (en), espéranto (eo), estonien (et), philippin (tagalog) (fil), finnois (fi), français (fr), frison (fy), galicien (gl), géorgien (ka), allemand (de), grec (el), gujarati (gu), créole haïtien (ht), haoussa (ha), hawaïen (haw), hébreu (iw), hindi (hi), hmong (hmn), hongrois (hu), islandais (is), igbo (ig), indonésien (id), irlandais (ga), italien (it), japonais (ja), javanais (jv), kannada (kn), kazakh (kk), khmer (km), coréen (ko), kurde (ku), kirghize (ky), lao (lo), latin (la), letton (lv), lituanien (lt), luxembourgeois (lb), macédonien (mk), malgache (mg), malais (ms), malayalam (ml), maltais (mt), maori (mi), marathi (mr), mongol (mn), birman (my), népalais (ne), nyanja (chichewa) (ny), norvégien (no), pachtou (ps), persan (fa), polonais (pl), portugais (pt), pendjabi (pa), roumain (ro), russe (ru), samoan (sm), gaélique écossais (gd), serbe (sr), sesotho (st), shona (sn), sindhi (sd), cingalais (si), slovaque (sk), slovène (sl), somali (so), espagnol (es), soundanais (su), swahili (sw), suédois (sv), tadjik (tg), tamoul (ta), télougou (te), thaï (th), turc (tr), ukrainien (uk), ourdou (ur), ouzbek (uz), vietnamien (vi), gallois (cy), xhosa (xh), yiddish (yi), yoruba (yo) et zoulou (zu).

Explorer tous les modèles dans Model Garden

Model Garden est une plate-forme qui vous permet de découvrir, de tester, de personnaliser et de déployer des modèles propriétaires de Google et de sélectionner des modèles et des éléments OSS. Pour explorer les modèles d'IA générative et les API disponibles sur Gemini Enterprise Agent Platform, accédez à Model Garden dans la Google Cloud console.

Accéder à Model Garden

Pour en savoir plus sur Model Garden, y compris sur les modèles et fonctionnalités disponibles, consultez la page Explorer les modèles d'IA dans Model Garden.

Versions de modèle

Pour afficher toutes les versions de modèle, y compris les modèles hérités et retirés, consultez la page Versions et cycle de vie des modèles.

Étape suivante