Gemini 3 Flash

Gemini 3 Flash combine les capacités de raisonnement de Gemini 3 Pro avec les niveaux de latence, d'efficacité et de coût de la gamme Flash. Il permet non seulement d'effectuer des tâches quotidiennes avec un raisonnement amélioré, mais est également conçu pour s'attaquer aux workflows agentifs les plus complexes.

Gemini 3 Flash utilise plusieurs nouvelles fonctionnalités pour améliorer les performances, le contrôle et la fidélité multimodale :

  • Niveau de réflexion : utilisez le paramètre thinking_level pour contrôler la quantité de raisonnement interne effectuée par le modèle (minimal, faible, moyen ou élevé) afin d'équilibrer la qualité de la réponse, la complexité du raisonnement, la latence et le coût. Le paramètre thinking_level remplace thinking_budget pour les modèles Gemini 3.

    Pour en savoir plus sur les différents niveaux de réflexion, consultez Réflexion.

  • Signatures de pensée : la validation plus stricte des signatures de pensée améliore la fiabilité de l'appel de fonction multitours.

  • Résolution du contenu multimédia : utilisez le paramètre media_resolution (low, medium, high ou ultra high) pour contrôler le traitement de la vision pour les entrées multimodales, ce qui a un impact sur l'utilisation des jetons et la latence. Consultez Premiers pas avec Gemini 3 pour connaître les paramètres de résolution par défaut.

    • Le niveau de résolution ultra-élevé n'est disponible que pour la modalité IMAGE.
    • Le nombre de jetons PDF sera indiqué sous la modalité IMAGE au lieu de la modalité DOCUMENT dans usage_metadata.
  • Réponses de fonction multimodales : les réponses de fonction peuvent désormais inclure des objets multimodaux tels que des images et des PDF, en plus du texte.

  • Appel de fonction de streaming : diffusez des arguments d'appel de fonction partiels pour améliorer l'expérience utilisateur lors de l'utilisation d'outils.

Pour en savoir plus sur l'utilisation de ces fonctionnalités, consultez Premiers pas avec Gemini 3.

Essayer dans Vertex AI Afficher dans Model Garden (Preview) Déployer un exemple d'application

Remarque : Pour utiliser la fonctionnalité "Déployer un exemple d'application", vous devez disposer d'un projet Google Cloud avec la facturation et l'API Vertex AI activées.
ID du modèle gemini-3-flash-preview
Entrées et sorties acceptées
  • Entrées :
    texte, code, images, audio, vidéo, PDF
  • Sorties :
    texte
Limites de jetons
  • Nombre maximal de jetons d'entrée : 1 048 576
  • Nombre maximal de jetons de sortie : 65 536
Capacités
Types d'utilisation
Spécifications techniques
Images
  • Nombre maximal d'images par requête : 900
  • Taille maximale par fichier pour les données intégrées ou les importations directes à l'aide de la console : 7 Mo
  • Taille maximale par fichier depuis Google Cloud Storage : 30 Mo
  • Jetons de résolution par défaut : 1120
  • Types MIME compatibles :
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documents
  • Nombre maximal de fichiers par requête : 900
  • Nombre maximal de pages par fichier : 900
  • Taille maximale par fichier pour les importations avec l'API ou Cloud Storage : 50 Mo
  • Taille maximale par fichier pour les importations directes à l'aide de la console : 7 Mo
  • Jetons de résolution par défaut : 560
  • OCR pour les PDF numérisés : Non utilisé par défaut
  • Types MIME compatibles :
    application/pdf, text/plain
Vidéo
  • Durée maximale d'une vidéo (avec audio) : environ 45 minutes
  • Durée maximale d'une vidéo (sans audio) : environ une heure
  • Nombre maximal de vidéos par prompt : 10
  • Jetons de résolution par défaut par frame : 70
  • Types MIME compatibles :
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durée audio maximale par requête : environ 8, 4 heures ou jusqu'à un million de jetons
  • Nombre maximal de fichiers audio par prompt : 1
  • Compréhension de la parole pour : résumé audio, transcription et traduction
  • Types MIME compatibles :
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Paramètres par défaut
  • Température : 0,0 à 2,0 (par défaut 1,0)
  • topP : 0,0-1,0 (valeur par défaut : 0,95)
  • Top-K : 64 (fixe)
  • candidateCount : 1 à 8 (par défaut : 1)
Régions où le service est disponible

Disponibilité du modèle

(y compris Standard PayGo et le débit provisionné)

  • Monde
    • global
Pour en savoir plus, consultez Déploiements et points de terminaison.
Date limite des connaissances Janvier 2025
Versions
  • gemini-3-flash-preview
    • Étape de lancement : version Preview publique
    • Date de sortie : 17 décembre 2025
Contrôles de sécurité
Prédiction en ligne
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Prédiction par lot
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Réglage
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Mise en cache du contexte
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Pour en savoir plus, consultez Contrôles de sécurité.
Langues disponibles Consultez Langues acceptées.
Tarifs Voir les tarifs