Modèles Google

Modèles Gemini mis en avant

Modèles Gemini disponibles

🍌 Gemini 3.1 Flash Image Transformez vos idées en éléments prêts pour la production. Retouche conversationnelle, fusion de plusieurs images et cohérence des personnages pour des workflows créatifs avancés.
🍌 Gemini 3 Pro Image Génération d'images haute fidélité avec composition améliorée par le raisonnement. Prise en charge du rendu de texte lisible, de la retouche multitour complexe et de la cohérence des personnages à l'aide de 14 entrées de référence au maximum.
spark Gemini 3.5 Flash Gemini 3.5 Flash offre une intelligence quasi professionnelle au coût et à la vitesse du niveau Flash : compétences en codage de niveau professionnel, exécution agentique parallèle, le tout au même prix qu'un modèle Flash.
performance_auto Gemini 3.1 Flash-Lite Notre modèle le plus économique, optimisé pour les cas d'utilisation à faible latence pour le trafic LLM élevé et sensible aux coûts.
diamond Gemini 2.5 Pro Notre modèle haute capacité pour le raisonnement et le codage complexes. Fonctionnalités de réflexion adaptative pour résoudre des défis agentiques et multimodaux complexes avec un contexte de 1 million de jetons.
spark Gemini 2.5 Flash Ultra-rapide et très performant. Offre un équilibre entre intelligence et latence avec des budgets de réflexion contrôlables pour des applications polyvalentes.
🍌 Gemini 2.5 Flash Image Transformez vos idées en éléments prêts pour la production. Retouche conversationnelle, fusion de plusieurs images et cohérence des personnages pour des workflows créatifs avancés.
performance_auto Gemini 2.5 Flash-Lite Conçu pour une mise à l'échelle massive. Équilibre entre coût et performances pour les tâches à haut débit, optimisé pour l'efficacité sans sacrifier la compréhension multimodale.
audio_spark Gemini 2.5 Flash avec l'API Gemini Live Conçu pour le streaming bidirectionnel en temps réel. Fonctionnalités audio et de dialogue affectif intégrées à faible latence pour des interactions naturelles et conversationnelles.
spark Gemini 2.0 Flash Performances multimodales pour les développeurs qui ont besoin d'un modèle économique pour les tâches à usage général.
performance_auto Gemini 2.0 Flash-Lite Rationalisé et ultra-efficace pour les tâches simples et à haute fréquence où la vitesse et le prix sont prioritaires.

Modèles Gemini en preview

preview Gemini 3.1 Flash Image Transformez vos idées en éléments prêts pour la production. Retouche conversationnelle, fusion de plusieurs images et cohérence des personnages pour des workflows créatifs avancés.
preview Gemini 3.1 Pro Notre dernier modèle axé sur le raisonnement, optimisé pour les workflows agentiques et le codage complexes. Fonctionnalités de réflexion adaptative, fenêtre de contexte de 1 million de jetons et ancrage intégré pour une résolution de problèmes multimodaux sophistiquée.
preview Gemini 3 Flash Notre meilleur modèle pour la compréhension multimodale complexe, conçu pour résoudre les problèmes agentiques les plus difficiles grâce à de solides capacités de codage et de raisonnement de pointe.
preview Gemini 3 Pro Image Génération d'images haute fidélité avec composition améliorée par le raisonnement. Prise en charge du rendu de texte lisible, de la retouche multitour complexe et de la cohérence des personnages à l'aide de 14 entrées de référence au maximum.

Modèles Gemma

Gemma 4 Modèle ouvert adapté aux tâches telles que la génération de texte, le codage et le raisonnement, et compatible avec l'entrée multimodale (texte et image pour toutes les variantes, et audio en plus pour les variantes E2B et E4B).
Gemma 3n Modèle ouvert conçu pour une exécution efficace sur les appareils à faibles ressources, compatible avec l'entrée multimodale (texte, image, vidéo et audio) et la sortie de texte dans plus de 140 langues.
Gemma 3 Modèle ouvert avec entrée de texte et d'image, prise en charge de plus de 140 langues et fenêtre de contexte de 128 000 jetons.
Gemma 2 Modèle ouvert compatible avec la génération, la synthèse et l'extraction de texte.
Gemma Modèle ouvert léger et de petite taille compatible avec la génération, la synthèse et l'extraction de texte.
ShieldGemma 2 Modèles réglés sur les instructions pour évaluer la sécurité du texte et des images par rapport aux règles définies.
PaliGemma Modèle ouvert de vision-langage combinant SigLIP et Gemma.
CodeGemma Modèle ouvert puissant et léger pour les tâches de codage, y compris la complétion, la génération et la compréhension de code.
TxGemma Modèle qui génère des prédictions, des classifications ou du texte en fonction de données liées à la thérapie, pour créer des modèles d'IA avec moins de données et de calcul.
MedGemma Collection de variantes de Gemma 3 entraînées pour des performances optimales en matière de compréhension de texte et d'images médicales.
MedSigLIP Variante de SigLIP entraînée pour encoder des images et du texte médicaux dans un espace d'embedding commun.
T5Gemma Famille de modèles de recherche d'encodeur/décodeur légers.

Modèles d'embeddings

width_normal Embeddings pour le texte Convertit les données textuelles en représentations vectorielles pour la recherche sémantique, la classification et le clustering.
width_normal Embeddings multimodaux Génère des vecteurs basés sur des images, pour des tâches telles que la classification et la recherche d'images.

Modèles Veo

movie Veo 2 Generate Génère des vidéos à partir de requêtes textuelles et d'images.
film Veo 3 Generate Génère des vidéos de haute qualité à partir de requêtes textuelles et d'images.
movie Veo 3 Fast Génère des vidéos de haute qualité et à faible latence à partir de requêtes textuelles et d'images.
movie Veo 3.1 Generate Génère des vidéos de haute qualité à partir de requêtes textuelles et d'images.
movie Veo 3.1 Fast Génère des vidéos de haute qualité et à faible latence à partir de requêtes textuelles et d'images.

Modèles Veo en preview

movie Veo 3.1 Lite preview Génère des vidéos de haute qualité et à faible coût à partir de requêtes textuelles et d'images.
movie Veo 3 Generate preview Génère des vidéos de haute qualité à partir de requêtes textuelles et d'images.
movie Veo 3 Fast preview Génère des vidéos de haute qualité et à faible latence à partir de requêtes textuelles et d'images.
movie Veo 3.1 Generate preview Génère des vidéos de haute qualité à partir de requêtes textuelles et d'images.
movie Veo 3.1 Fast preview Génère des vidéos de haute qualité et à faible latence à partir de requêtes textuelles et d'images.
movie Veo 2 Preview Génère des vidéos à partir de requêtes textuelles et d'images, et prend en charge la retouche intérieure et extérieure.

Modèles Veo expérimentaux

movie Veo 2 Experimental Modèle expérimental avec des fonctionnalités en cours de test.

Modèles Lyria

music_note_spark Lyria 3 Pro (preview) Génère des pistes musicales complètes à partir de requêtes textuelles et d'images.
music_note_spark Lyria 3 Clip (preview) Génère des clips audio de 30 secondes à partir de requêtes textuelles et d'images.
audio_spark Lyria 2 Génère de la musique à partir de requêtes textuelles.

Langues acceptées

Gemini

Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes :

Afrikaans (af), albanais (sq), amharique (am), arabe (ar), arménien (hy), assamais (as), azerbaïdjanais (az), basque (eu), biélorusse (be), bengali (bn), bosnien (bs), bulgare (bg), catalan (ca), cebuano (ceb), chinois (simplifié et traditionnel) (zh), corse (co), croate (hr), tchèque (cs), danois (da), divehi (dv), néerlandais (nl), anglais (en), espéranto (eo), estonien (et), philippin (tagalog) (fil), finnois (fi), français (fr), frison (fy), galicien (gl), géorgien (ka), allemand (de), grec (el), gujarati (gu), créole haïtien (ht), haoussa (ha), hawaïen (haw), hébreu (iw), hindi (hi), hmong (hmn), hongrois (hu), islandais (is), igbo (ig), indonésien (id), irlandais (ga), italien (it), japonais (ja), javanais (jv), kannada (kn), kazakh (kk), khmer (km), coréen (ko), krio (kri), kurde (ku), kirghize (ky), lao (lo), latin (la), letton (lv), lituanien (lt), luxembourgeois (lb), macédonien (mk), malgache (mg), malais (ms), malayalam (ml), maltais (mt), maori (mi), marathi (mr), meitei (manipuri) (mni-Mtei), mongol (mn), birman (my), népalais (ne), norvégien (no), nyanja (chichewa) (ny), odia (oriya) (or), pachtou (ps), persan (fa), polonais (pl), portugais (pt), pendjabi (pa), roumain (ro), russe (ru), samoan (sm), gaélique écossais (gd), serbe (sr), sesotho (st), shona (sn), sindhi (sd), cingalais (si), slovaque (sk), slovène (sl), somali (so), espagnol (es), soundanais (su), swahili (sw), suédois (sv), tadjik (tg), tamoul (ta), télougou (te), thaï (th), turc (tr), ukrainien (uk), ourdou (ur), ouïghour (ug), ouzbek (uz), vietnamien (vi), gallois (cy), xhosa (xh), yiddish (yi), yoruba (yo) et zoulou (zu).

Gemma

Gemma et Gemma 2 ne sont compatibles qu'avec l'anglais (en). Gemma 3 et Gemma 3n sont compatibles avec plus de 140 langues.

Embeddings

Les modèles d'embedding textuel multilingues sont compatibles avec les langues suivantes :

Afrikaans (af), albanais (sq), amharique (am), arabe (ar), arménien (hy), azerbaïdjanais (az), basque (eu), biélorusse (be), bengali (bn), bulgare (bg), catalan (ca), cebuano (ceb), chinois (simplifié et traditionnel) (zh), corse (co), tchèque (cs), danois (da), néerlandais (nl), anglais (en), espéranto (eo), estonien (et), philippin (tagalog) (fil), finnois (fi), français (fr), frison (fy), galicien (gl), géorgien (ka), allemand (de), grec (el), gujarati (gu), créole haïtien (ht), haoussa (ha), hawaïen (haw), hébreu (iw), hindi (hi), hmong (hmn), hongrois (hu), islandais (is), igbo (ig), indonésien (id), irlandais (ga), italien (it), japonais (ja), javanais (jv), kannada (kn), kazakh (kk), khmer (km), coréen (ko), kurde (ku), kirghize (ky), lao (lo), latin (la), letton (lv), lituanien (lt), luxembourgeois (lb), macédonien (mk), malgache (mg), malais (ms), malayalam (ml), maltais (mt), maori (mi), marathi (mr), mongol (mn), birman (my), népalais (ne), nyanja (chichewa) (ny), norvégien (no), pachtou (ps), persan (fa), polonais (pl), portugais (pt), pendjabi (pa), roumain (ro), russe (ru), samoan (sm), gaélique écossais (gd), serbe (sr), sesotho (st), shona (sn), sindhi (sd), cingalais (si), slovaque (sk), slovène (sl), somali (so), espagnol (es), soundanais (su), swahili (sw), suédois (sv), tadjik (tg), tamoul (ta), télougou (te), thaï (th), turc (tr), ukrainien (uk), ourdou (ur), ouzbek (uz), vietnamien (vi), gallois (cy), xhosa (xh), yiddish (yi), yoruba (yo) et zoulou (zu).

Explorer tous les modèles dans Model Garden

Model Garden est une plate-forme qui vous permet de découvrir, de tester, de personnaliser et de déployer des modèles propriétaires de Google, puis de sélectionner des modèles et des éléments OSS. Pour explorer les modèles d'IA générative et les API disponibles sur Gemini Enterprise Agent Platform, accédez à Model Garden dans la Google Cloud console.

Accéder à Model Garden

Pour en savoir plus sur Model Garden, y compris sur les modèles et fonctionnalités disponibles, consultez la page Explorer les modèles d'IA dans Model Garden.

Versions de modèle

Pour afficher toutes les versions de modèle, y compris les modèles hérités et ceux qui ne sont plus disponibles, consultez la page Versions et cycle de vie des modèles.

Étape suivante