Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Embedding Gemini 2

Gemini Embedding 2 è il modello di generazione di incorporamenti di Google ideale per attività complesse di recupero e analisi.

Gemini Embedding 2 accetta input multimodali per generare vettori a 3072 dimensioni. Accetta input di immagini, testo, documenti, audio e video e mappa semanticamente i vettori generati in uno spazio semantico unificato. In questo modo puoi eseguire attività come la ricerca di un'immagine in base a una descrizione testuale.

Gemini Embedding 2 introduce diverse funzionalità per ottimizzare la qualità e la flessibilità degli incorporamenti:

Istruzioni per le attività personalizzate: specificando le istruzioni per le attività (ad esempio, task:code retrieval o task:search result), puoi ottimizzare gli incorporamenti per le relazioni previste e recuperare risultati più precisi per l'obiettivo specifico.
Dimensioni dei risultati regolabili: per impostazione predefinita, il modello genera un vettore float a 3072 dimensioni. Tuttavia, puoi recuperare un output con dimensioni inferiori specificando il parametro output_dimensionality.
OCR dei documenti: leggi l'OCR dagli input dei documenti.
Estrazione delle tracce audio: estrai le tracce audio dagli input video e intervallale con i fotogrammi video.

Prova in Agent Platform (anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con la fatturazione e l'API Agent Platform abilitate.

Specifiche tecniche
ID modello	`gemini-embedding-2`
Input e output supportati	Input: Testo, Immagini, Audio, Video, PDF Output: incorporamenti
Limiti di token	Numero massimo di token di input: 8192 Numero massimo di token di output: N/A
Lunghezza massima della sequenza	8192 token
Dimensioni di output	Fino a 3072 (con supporto MRL)
Opzioni di consumo	Supportato Standard Pay as you go Non supportato Throughput riservato Flex Pay as you go Priorità Pay as you go Previsioni in batch
Opzioni di consumo	Per ulteriori informazioni, consulta Opzioni di consumo.
	Immagini	Numero massimo di immagini per prompt: 6 Dimensione massima dei file per i dati in linea o i caricamenti diretti tramite la console: Nessun limite Dimensione massima dei file da Google Cloud Storage: nessun limite Numero massimo di immagini di output per prompt: N/A Tipi MIME supportati: `image/png`, `image/jpeg`
	Documenti	Numero massimo di file per prompt: 1 Numero massimo di pagine per file: 6 Dimensione massima dei file: N/A Tipi MIME supportati: `application/pdf`
	Video	Durata massima del video (con audio): 80 secondi Durata massima del video (senza audio): 120 secondi Numero massimo di video per prompt: 1 Tipi MIME supportati: `video/mpeg`, `video/mp4`
	Audio	Durata massima dell'audio per prompt: 180 secondi Numero massimo di file audio per prompt: 1 Tipi MIME supportati: `audio/mp3`, `audio/wav`
	Valori predefiniti dei parametri
Aree geografiche supportate
	Disponibilità del modello	Globale globale Multi-regione Stati Uniti (vedi la guida alla connessione) us Multi-regione Europa (vedi la guida alla connessione) eu
	Per ulteriori informazioni, consulta Deployment ed endpoint.
Data di knowledge cutoff	Novembre 2025
Versioni	`gemini-embedding-2` Fase di avvio: GA Data di rilascio: 22 aprile 2026 `gemini-embedding-2-preview` Fase di avvio: anteprima pubblica Data di rilascio: 10 marzo 2026
Controlli di sicurezza
Controlli di sicurezza	Per ulteriori informazioni, consulta Controlli di sicurezza.
Lingue supportate	Consulta Lingue supportate.
Prezzi	Consulta Prezzi.

Embedding Gemini 2 Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Embedding Gemini 2