Embedding Gemini 2

Gemini Embedding 2 est le modèle de génération d'embeddings de Google, idéal pour les tâches complexes de récupération et d'analyse.

Gemini Embedding 2 accepte les entrées multimodales pour générer des vecteurs de 3 072 dimensions. Il accepte les images, le texte, les documents, l'audio et la vidéo en entrée, et mappe sémantiquement les vecteurs générés dans un espace sémantique unifié. Cela vous permet d'effectuer des tâches telles que la recherche d'une image à partir d'une description textuelle.

Gemini Embedding 2 introduit plusieurs fonctionnalités pour optimiser la qualité et la flexibilité des embeddings :

  • Instructions de tâches personnalisées : en spécifiant des instructions de tâches (par exemple, task:code retrieval ou task:search result), vous optimisez les embeddings pour les relations souhaitées et obtenez des résultats plus précis pour l'objectif spécifique.

  • Taille de résultat ajustable : par défaut, le modèle génère un vecteur float de 3 072 dimensions. Toutefois, vous pouvez récupérer une sortie dimensionnelle plus petite en spécifiant le paramètre output_dimensionality.

  • Reconnaissance optique des caractères dans les documents : lisez la reconnaissance optique des caractères à partir des entrées de documents.

  • Extraction de pistes audio : extraire des pistes audio à partir d'entrées vidéo et les entrelacer avec des images vidéo.

Essayer dans Agent Platform (Preview) Déployer un exemple d'application

Remarque : Pour utiliser la fonctionnalité "Déployer un exemple d'application", vous devez disposer d'un projet Google Cloud avec la facturation et l'API Agent Platform activées.
ID du modèle gemini-embedding-2
Entrées et sorties acceptées
  • Entrées :
    texte, images, audio, vidéo, PDF
  • Sorties :
    Intégrations
Limites de jetons
  • Nombre maximal de jetons d'entrée : 8 192
  • Nombre maximal de jetons de sortie : N/A
Longueur maximale de la séquence

8 192 jetons

Dimensions de sortie

Jusqu'à 3 072 (avec prise en charge MRL)

Options de consommation
Pour en savoir plus, consultez Options de consommation.
Spécifications techniques
Images
  • Nombre maximal d'images par requête : 6
  • Taille maximale par fichier pour les données intégrées ou les importations directes à l'aide de la console : aucune limite
  • Taille maximale par fichier depuis Google Cloud Storage : aucune limite
  • Nombre maximal d'images générées par prompt : N/A
  • Types MIME compatibles :
    image/png, image/jpeg
Documents
  • Nombre maximal de fichiers par requête : 1
  • Nombre maximal de pages par fichier : 6
  • Taille maximale par fichier : N/A
  • Types MIME acceptés :
    application/pdf
Vidéo
  • Durée maximale de la vidéo (avec audio) : 80 secondes
  • Durée maximale d'une vidéo (sans audio) : 120 secondes
  • Nombre maximal de vidéos par requête : 1
  • Types MIME compatibles :
    video/mpeg, video/mp4
Audio
  • Durée audio maximale par requête : 180 secondes
  • Nombre maximal de fichiers audio par prompt : 1
  • Types MIME compatibles :
    audio/mp3, audio/wav
Paramètres par défaut
Régions où le service est disponible

Disponibilité du modèle

Pour en savoir plus, consultez Déploiements et points de terminaison.
Date limite des connaissances Novembre 2025
Versions
  • gemini-embedding-2
    • Étape de lancement : disponibilité générale
    • Date de disponibilité : 22 avril 2026
  • gemini-embedding-2-preview
    • Étape de lancement : version Preview publique
    • Date de disponibilité : 10 mars 2026
Contrôles de sécurité
Pour en savoir plus, consultez Contrôles de sécurité.
Langues disponibles Consultez la section Langues disponibles.
Tarifs Voir les tarifs