Google utilise la technologie IA pour traduire le contenu dans votre langue préférée. Les traductions générées par IA peuvent contenir des erreurs.

Embedding Gemini 2

Gemini Embedding 2 est le modèle de génération d'embeddings de Google, idéal pour les tâches complexes de récupération et d'analyse.

Gemini Embedding 2 accepte les entrées multimodales pour générer des vecteurs de 3 072 dimensions. Il accepte les entrées d'images, de texte, de documents, d'audio et de vidéo, et mappe sémantiquement les vecteurs générés dans un espace sémantique unifié. Vous pouvez ainsi effectuer des tâches telles que la recherche d'une image à partir d'une description textuelle.

Gemini Embedding 2 introduit plusieurs fonctionnalités pour optimiser la qualité et la flexibilité des embeddings :

Instructions de tâche personnalisées : en spécifiant des instructions de tâche (par exemple, task:code retrieval ou task:search result), vous optimisez les embeddings pour les relations souhaitées et obtenez des résultats plus précis pour l'objectif spécifique.
Taille de résultat ajustable : par défaut, le modèle génère un vecteur flottant de 3 072 dimensions. Toutefois, vous pouvez récupérer une sortie de dimensionnalité inférieure en spécifiant le paramètre output_dimensionality.
OCR de documents : lisez l'OCR à partir des entrées de documents.
Extraction de pistes audio : extrayez les pistes audio des entrées vidéo et entrelacez-les avec les images vidéo.

Pour en savoir plus sur l'utilisation de Gemini Embedding 2, consultez Obtenir des embeddings multimodaux.

Essayer dans Agent Studio Déployer un exemple d'application Afficher les tarifs

Remarque : Pour "Déployer un exemple d'application", vous devez disposer d'un projet Google Cloud avec la facturation et l'API Agent Platform activées.

ID du modèle	`gemini-embedding-2`
Modalités	Text Input only Image Input only Audio Input only Video Input only Embeddings Output only
Limites de jetons	Nombre maximal de jetons d'entrée	8 192
Limites de jetons	Nombre maximal de jetons de sortie	N/A
Dimensions de sortie	Jusqu'à 3 072 (avec prise en charge de MRL)
Longueur maximale de la séquence	8 192 jetons
Options de consommation	Débit provisionné Non compatible Inférence par lot Non disponible Pay-as-you-go Paiement à l'usage standard Compatible Quota fixe Non compatible
Spécifications techniques	Text	Nombre maximal de jetons d'entrée : 8 192 Nombre maximal de fichiers par prompt : 1 Nombre maximal de pages par fichier (pour les PDF) : 6 Taille maximale par fichier : N/A OCR pour les PDF scannés : non utilisé par défaut Types MIME compatibles : `text/plain`, `application/pdf`
	photo	Nombre maximal d'images par prompt : 6 Taille maximale par fichier pour les données intégrées ou les importations directes via la console : Aucune limite Taille maximale par fichier depuis Google Cloud Storage: aucune limite Nombre maximal d'images générées par prompt : N/A Types MIME compatibles : `image/png`, `image/jpeg`, `image/webp`, `image/bmp`, `image/heic`, `image/heif`, `image/avif`
	Vidéo	Durée maximale d'une vidéo (avec audio) : 80 secondes Durée maximale d'une vidéo (sans audio) : 120 secondes Nombre maximal de vidéos par prompt : 1 Types MIME compatibles : `video/mpeg`, `video/mp4`
	Audio	Durée maximale de l'audio par prompt : 180 secondes Nombre maximal de fichiers audio par prompt : 1 Types MIME compatibles : `audio/mp3`, `audio/wav`
Régions où le service est disponible	Disponibilité du modèle	Champ d'application global : `global` Multirégional (États-Unis) : `us` Multirégional (Europe) : `eu`
Date limite des connaissances	Novembre 2025
Versions	`gemini-embedding-2` Étape de lancement : GA Date de disponibilité : 22 avril 2026 `gemini-embedding-2-preview` Étape de lancement : version Preview publique Date de disponibilité : 10 mars 2026

Embedding Gemini 2 Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Embedding Gemini 2