Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Modèles Google

Modèles Gemini à la une

3.5 Flash

Conçu pour offrir de solides capacités agentiques (proches du niveau Pro) à un prix et une vitesse intéressants.

Compétences en programmation de niveau professionnel et exécution agentique parallèle
Il dispose d'une fenêtre de contexte d'un million de jetons.
Intelligence quasi professionnelle, avec le coût et la vitesse du niveau Flash

3.1 Flash-Lite

Notre modèle le plus économique, optimisé pour les cas d'utilisation à faible latence pour le trafic LLM à fort volume et sensible aux coûts

Optimisé pour une faible latence et un trafic à volume élevé
Amélioration de la qualité des réponses et du respect des instructions
Amélioration de la qualité de l'entrée audio pour les tâches de reconnaissance vocale automatique

3.1 Image Flash

Transformez vos idées en assets prêts pour la production

Générer des images de haute qualité
Capable de retouche conversationnelle au tour par tour
Capable de fusionner plusieurs images et d'assurer la cohérence des personnages pour les workflows créatifs avancés

Modèles Gemini en disponibilité générale

🍌 Gemini 3.1 Flash-Lite Image (Nano Banana 2 Lite) Transformez vos idées en composants prêts pour la production. Conçu pour les charges de travail à fort volume et sensibles à la latence.

🍌 Gemini 3.1 Flash Image Transformez vos idées en ressources prêtes pour la production. Il propose des fonctionnalités de retouche conversationnelle, de fusion de plusieurs images et de cohérence des personnages pour les workflows créatifs avancés.

🍌 Image Gemini 3 Pro Génération d'images haute fidélité avec composition améliorée par le raisonnement. Permet un rendu de texte lisible, une édition multitour complexe et la cohérence des personnages à l'aide de 14 entrées de référence maximum.

spark Gemini 3.5 Flash Gemini 3.5 Flash offre une intelligence proche de celle de Pro, à la vitesse et au coût du niveau Flash : compétences en programmation de niveau Pro, exécution agentique parallèle, le tout au même prix qu'un modèle Flash.

performance_auto Gemini 3.1 Flash-Lite Notre modèle le plus économique, optimisé pour les cas d'utilisation à faible latence, destiné au trafic à haut volume et sensible aux coûts lié aux grands modèles de langage (LLM).

diamond Gemini 2.5 Pro Notre modèle très performant pour le raisonnement complexe et le codage. Il est capable de s'adapter pour résoudre des problèmes complexes d'agentivité et de multimodalité avec un contexte d'un million de jetons.

spark Gemini 2.5 Flash Rapide comme l'éclair et très performant. Équilibre l'intelligence et la latence avec des budgets de réflexion contrôlables pour des applications polyvalentes.

🍌 Gemini 2.5 Flash Image Transformez vos idées en assets prêts pour la production. Il propose des fonctionnalités de retouche conversationnelle, de fusion de plusieurs images et de cohérence des personnages pour les workflows créatifs avancés.

performance_auto Gemini 2.5 Flash-Lite Conçu pour une évolutivité massive. Équilibre le coût et les performances pour les tâches à haut débit, optimisé pour l'efficacité sans sacrifier la compréhension multimodale.

audio_spark Gemini 2.5 Flash avec l'API Gemini Live Conçu pour le streaming bidirectionnel en temps réel. Il offre des fonctionnalités audio et de dialogue affectif intégrées à faible latence pour des interactions conversationnelles naturelles.

Aperçu des modèles Gemini

preview Gemini Omni Flash Générez des vidéos à partir de texte ou d'éléments de référence, ou modifiez des vidéos existantes.

preview Gemini 3.1 Flash Image Transformez vos idées en assets prêts à être diffusés. Il propose des fonctionnalités de retouche conversationnelle, de fusion de plusieurs images et de cohérence des personnages pour les workflows créatifs avancés.

preview Gemini 3.1 Pro Notre dernier modèle axé sur le raisonnement, optimisé pour les workflows agentiques complexes et le codage. Il est doté d'une pensée adaptative, d'une fenêtre de contexte d'un million de jetons et d'un ancrage intégré pour résoudre des problèmes multimodaux complexes.

preview Gemini 3 Flash Notre meilleur modèle pour la compréhension multimodale complexe, conçu pour résoudre les problèmes agentifs les plus difficiles grâce à de solides capacités de codage et de raisonnement de pointe.

preview Gemini 3 Pro Image Génération d'images haute fidélité avec composition améliorée par le raisonnement. Permet un rendu de texte lisible, une édition multitour complexe et la cohérence des personnages à l'aide de 14 entrées de référence maximum.

Modèles Gemma

Gemma 4 Modèle ouvert adapté aux tâches telles que la génération de texte, le codage et le raisonnement, et prenant en charge les entrées multimodales (texte et image pour toutes les variantes, et audio en plus pour les variantes E2B et E4B).

Gemma 3n Modèle ouvert conçu pour une exécution efficace sur les appareils à faibles ressources, prenant en charge les entrées multimodales (texte, image, vidéo et audio) et les sorties de texte dans plus de 140 langues.

Gemma 3 Un modèle ouvert avec saisie de texte et d'images, compatible avec plus de 140 langues et une fenêtre contextuelle de 128 K.

Gemma 2 Modèle ouvert permettant la génération, la synthèse et l'extraction de texte.

Gemma Modèle ouvert léger et de petite taille compatible avec la génération, la synthèse et l'extraction de texte.

ShieldGemma 2 Modèles réglés sur les instructions pour évaluer la sécurité du texte et des images par rapport aux règles définies.

PaliGemma Un modèle ouvert de vision-langage combinant SigLIP et Gemma.

CodeGemma Un modèle ouvert puissant et léger pour les tâches de codage, y compris la complétion, la génération et la compréhension de code.

TxGemma Modèle qui génère des prédictions, des classifications ou du texte en fonction de données liées à la thérapie, pour créer des modèles d'IA avec moins de données et de calculs.

MedGemma Collection de variantes Gemma 3 entraînées pour comprendre les textes et les images médicaux.

MedSigLIP Variante de SigLIP entraînée pour encoder des images et du texte médicaux dans un espace d'embedding commun.

T5Gemma Une famille de modèles de recherche d'encodeur-décodeur légers.

Modèles d'embeddings

width_normal Représentations vectorielles continues pour le texte Convertit les données textuelles en représentations vectorielles pour la recherche sémantique, la classification et le clustering.

width_normal Embeddings multimodaux Génère des vecteurs à partir d'images, pour des tâches telles que la classification et la recherche d'images.

Modèles Veo

movie Veo 2 Generate Génère des vidéos à partir de requêtes textuelles et d'images.

movie Veo 3 Generate Génère des vidéos de haute qualité à partir de requêtes textuelles et d'images.

movie Veo 3 Fast Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité avec une faible latence.

movie Veo 3.1 Generate Génère des vidéos de haute qualité à partir de requêtes textuelles et d'images.

movie Veo 3.1 Fast Génère des vidéos à partir de requêtes textuelles et d'images de haute qualité avec une faible latence.

Prévisualiser les modèles Veo

movie Aperçu de Veo 3.1 Lite Générez des vidéos à partir de requêtes textuelles et d'images de haute qualité à faible coût.

Modèles Lyria

music_note_spark Lyria 3 Pro (Aperçu) Génère des pistes musicales complètes à partir de requêtes textuelles et d'images.

music_note_spark Lyria 3 Clip (Aperçu) Génère des extraits audio de 30 secondes à partir de requêtes textuelles et d'images.

audio_spark Lyria 2 Génère de la musique à partir de requêtes textuelles.

Langues acceptées

Gemini

Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes :

Afrikaans (af), Albanais (sq), Amharique (am), Arabe (ar), Arménien (hy), Assamais (as), Azerbaïdjanais (az), Basque (eu), Biélorusse (be), Bengali (bn), Bosnien (bs), Bulgare (bg), Catalan (ca), Cebuano (ceb), Chinois (simplifié et traditionnel) (zh), Corse (co), Croate (hr), Tchèque (cs), Danois (da), Divehi (dv), Néerlandais (nl), Anglais (en), Espéranto (eo), Estonien (et), Filipino (Tagalog) (fil), Finnois (fi), Français (fr), Frison (fy), Galicien (gl), Géorgien (ka), Allemand (de), Grec (el), Goudjarati (gu), Créole haïtien (ht), Haoussa (ha), Hawaïen (haw), Hébreu (iw), Hindi (hi), Hmong (hmn), Hongrois (hu), Islandais (is), Igbo (ig), Indonésien (id), Irlandais (ga), Italien (it), Japonais (ja), Javanais (jv), Kannada (kn), Kazakh (kk), Khmer (km), Coréen (ko), Krio (kri), Kurde (ku), Kirghize (ky), Laotien (lo), Latin (la), Letton (lv), Lituanien (lt), Luxembourgeois (lb), Macédonien (mk), Malgache (mg), Malais (ms), Malayalam (ml), Maltais (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongol (mn), Birman (my), Népalais (ne), Norvégien (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Pachtou (ps), Persan (fa), Polonais (pl), Portugais (pt), Pendjabi (pa), Roumain (ro), Russe (ru), Samoan (sm), Gaélique écossais (gd), Serbe (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalais (si), Slovaque (sk), Slovène (sl), Somali (so), Espagnol (es), Soundanais (su), Swahili (sw), Suédois (sv), Tadjik (tg), Tamoul (ta), Télougou (te), Thaï (th), Turc (tr), Ukrainien (uk), Ourdou (ur), Ouïghour (ug), Ouzbek (uz), Vietnamien (vi), Gallois (cy), Xhosa (xh), Yiddish (yi), Yoruba (yo), et Zoulou (zu).

Gemma

Gemma et Gemma 2 ne sont disponibles qu'en anglais (en). Gemma 3 et Gemma 3n sont disponibles dans plus de 140 langues.

Embeddings

Les modèles d'embeddings textuels multilingues sont compatibles avec les langues suivantes :

Afrikaans (af), Albanais (sq), Amharique (am), Arabe (ar), Arménien (hy), Azerbaïdjanais (az), Basque (eu), Biélorusse (be), Bengali (bn), Bulgare (bg), Catalan (ca), Cebuano (ceb), Chinois (simplifié et traditionnel) (zh), Corse (co), Tchèque (cs), Danois (da), Néerlandais (nl), Anglais (en), Espéranto (eo), Estonien (et), Filipino (Tagalog) (fil), Finnois (fi), Français (fr), Frison (fy), Galicien (gl), Géorgien (ka), Allemand (de), Grec (el), Gourarati (gu), Créole haïtien (ht), Haoussa (ha), Hawaïen (haw), Hébreu (iw), Hindi (hi), Hmong (hmn), Hongrois (hu), Islandais (is), Igbo (ig), Indonésien (id), Irlandais (ga), Italien (it), Japonais (ja), Javanais (jv), Kannada (kn), Kazakh (kk), Khmer (km), Coréen (ko), Kurde (ku), Kirghize (ky), Laotien (lo), Latin (la), Letton (lv), Lituanien (lt), Luxembourgeois (lb), Macédonien (mk), Malgache (mg), Malais (ms), Malayalam (ml), Maltais (mt), Maori (mi), Marathi (mr), Mongol (mn), Birman (my), Népalais (ne), Nyanja (Chichewa) (ny), Norvégien (no), Pachtou (ps), Persan (fa), Polonais (pl), Portugais (pt), Pendjabi (pa), Roumain (ro), Russe (ru), Samoan (sm), Gaélique écossais (gd), Serbe (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalais (si), Slovaque (sk), Slovène (sl), Somali (so), Espagnol (es), Soundanais (su), Swahili (sw), Suédois (sv), Tadjik (tg), Tamil (ta), Télougou (te), Thaï (th), Turc (tr), Ukrainien (uk), Ourdou (ur), Ouzbek (uz), Vietnamien (vi), Gallois (cy), Xhosa (xh), Yiddish (yi), Yoruba (yo), et Zoulou (zu).

Explorer tous les modèles dans Model Garden

Model Garden est une plate-forme qui vous permet de découvrir, de tester, de personnaliser et de déployer des modèles de Google, puis de sélectionner des modèles et des éléments OSS. Pour explorer les modèles d'IA générative et les API disponibles sur Gemini Enterprise Agent Platform, accédez à Model Garden dans la console Google Cloud .

Accéder à la page "Jardin de modèles"

Pour en savoir plus sur Model Garden, y compris sur les modèles et fonctionnalités disponibles, consultez la page Explorer les modèles d'IA dans Model Garden.

Versions de modèle

Pour afficher toutes les versions de modèle, y compris les modèles anciens et abandonnés, consultez Versions et cycle de vie des modèles.

Modèles Google Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.