Gemini 2.0 Flash-Lite

Gemini 2.0 Flash-Lite est notre modèle Gemini 2.0 le plus rapide. Il est optimisé pour améliorer la rentabilité et réduire la latence.

Essayer dans Vertex AI Afficher dans Model Garden (Preview) Déployer un exemple d'application

Remarque : Pour utiliser la fonctionnalité "Déployer un exemple d'application", vous devez disposer d'un projet Google Cloud avec la facturation et l'API Vertex AI activées.
ID du modèle gemini-2.0-flash-lite
Entrées et sorties acceptées
  • Entrées :
    texte, code, images, audio, vidéo
  • Sorties :
    texte
Limites de jetons
  • Nombre maximal de jetons d'entrée : 1 048 576
  • Nombre maximal de jetons de sortie : 8 192 (par défaut)
Capacités
Types d'utilisation
Taille limite des entrées 500 Mo
Spécifications techniques
Images
  • Nombre maximal d'images par prompt : 3 000
  • Taille maximale par fichier pour les données intégrées ou les importations directes à l'aide de la console : 7 Mo
  • Taille maximale par fichier depuis Google Cloud Storage : 30 Mo
  • Nombre maximal de jetons par minute (TPM) :
    • Résolution des contenus multimédias élevée/moyenne/par défaut :
      • États-Unis/Asie : 6,7 M
      • UE : 2,6 M
    • Basse résolution des contenus multimédias :
      • États-Unis/Asie : 2,6 M
      • UE : 2,6 M
  • Types MIME compatibles :
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documents
  • Nombre maximal de fichiers par prompt : 3 000
  • Nombre maximal de pages par fichier : 1 000
  • Taille maximale par fichier pour les importations avec l'API ou Cloud Storage : 50 Mo
  • Taille maximale par fichier pour les importations directes à l'aide de la console : 7 Mo
  • Nombre maximal de jetons par minute et par projet1 :
    • États-Unis/Asie : 3,4 M
    • UE : 3,4 M
  • Types MIME acceptés :
Vidéo
  • Durée maximale d'une vidéo (avec audio) : environ 45 minutes
  • Durée maximale d'une vidéo (sans audio) : environ une heure
  • Nombre maximal de vidéos par prompt : 10
  • Nombre maximal de jetons par minute (TPM) :
    • Résolution des contenus multimédias élevée/moyenne/par défaut :
      • États-Unis/Asie : 6,3 M
      • UE : 3,2 M
    • Basse résolution des contenus multimédias :
      • États-Unis/Asie : 3,2 M
      • UE : 3,2 M
  • Types MIME compatibles :
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Durée audio maximale par prompt : environ 8,4 heures ou jusqu'à un million de jetons
  • Nombre maximal de fichiers audio par prompt : 1
  • Compréhension de la parole pour : résumé audio, transcription et traduction
  • Nombre maximal de jetons par minute (TPM) :
    • États-Unis/Asie : 3,5 M
    • UE : 3,5 M
  • Types MIME compatibles :
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Paramètres par défaut
  • Température : 0,0 à 2,0 (par défaut 1,0)
  • topP : 0,0-1,0 (valeur par défaut : 0,95)
  • Top-K : 64 (fixe)
  • candidateCount : 1 à 8 (par défaut : 1)
Régions où le service est disponible

Disponibilité du modèle

(y compris Standard PayGo avec niveaux d'utilisation et débit provisionné)

  • Monde
    • global
  • États-Unis
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europe
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

Traitement ML

  • États-Unis
    • Multirégional
  • Europe
    • Emplacement multirégional
Pour en savoir plus, consultez Déploiements et points de terminaison.
Date limite des connaissances Juin 2024
Versions
  • gemini-2.0-flash-lite-001
    • Étape de lancement : disponibilité générale
    • Date de disponibilité : 25 février 2025
    • Date d'arrêt : 3 mars 2026
Contrôles de sécurité
Prédiction en ligne
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Prédiction par lot
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Réglage
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Moteur RAG
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Mise en cache du contexte
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Ancrage avec la recherche Google et ancrage avec Google Maps
  • Résidence des données
  • CMEK
  • VPC-SC
  • AXT
Pour en savoir plus, consultez Contrôles de sécurité.
Langues disponibles Consultez Langues acceptées.
Tarifs Voir les tarifs