Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Embedding Gemini 2

Gemini Embedding 2 è il modello di generazione di embedding di Google ideale per attività complesse di recupero e analisi.

Gemini Embedding 2 accetta input multimodali per generare vettori a 3072 dimensioni. Accetta input di immagini, testo, documenti, audio e video e mappa semanticamente i vettori generati in uno spazio semantico unificato. In questo modo, puoi eseguire attività come la ricerca di un'immagine in base a una descrizione testuale.

Gemini Embedding 2 introduce diverse funzionalità per ottimizzare la qualità e la flessibilità degli embedding:

Istruzioni personalizzate per l'attività:specificando le istruzioni per l'attività (ad esempio, task:code retrieval o task:search result), ottimizza gli incorporamenti per le relazioni previste e recupera risultati più accurati per l'obiettivo specifico.
Dimensioni dei risultati regolabili:il modello genera un vettore float a 3072 dimensioni per impostazione predefinita. Tuttavia, puoi recuperare un output dimensionale più piccolo specificando il parametro output_dimensionality.
OCR di documenti:leggi l'OCR dagli input dei documenti.
Estrazione delle tracce audio:estrai le tracce audio dagli input video e alternale ai fotogrammi video.

Per saperne di più su come utilizzare Gemini Embedding 2, consulta Ottieni incorporamenti multimodali.

Prova in Agent Studio Esegui il deployment dell'app di esempio Visualizza i prezzi

Nota: "Deploy example app" richiede un progetto Google Cloud con fatturazione e API Agent Platform abilitate.

ID modello	`gemini-embedding-2`
Modalità	Testo Solo input Immagine Solo input Audio Solo input Video Solo input Incorporamenti Solo output
Limiti di token	Numero massimo di token di input	8192
Limiti di token	Numero massimo di token di output	N/D
Dimensioni di output	Fino a 3072 (con supporto MRL)
Lunghezza massima della sequenza	8192 token
Opzioni di consumo	Throughput riservato Non supportato Inferenza batch Non supportato Pay-as-you-go Standard PayGo Supportato Quota fissa Non supportato
Specifiche tecniche	Testo	Token di input massimi: 8192 Numero massimo di file per prompt: 1 Numero massimo di pagine per file (per PDF): 6 Dimensioni massime del file per file: N/A OCR per i PDF scansionati: Non utilizzato per impostazione predefinita Tipi MIME supportati: `text/plain`, `application/pdf`
	Immagine	Numero massimo di immagini per prompt: 6 Dimensione massima dei file per i dati in linea o i caricamenti diretti tramite la console: Nessun limite Dimensioni massime per file da Google Cloud Storage: Nessun limite Numero massimo di immagini di output per prompt: N/A Tipi MIME supportati: `image/png`, `image/jpeg`, `image/webp`, `image/bmp`, `image/heic`, `image/heif`, `image/avif`
	Video	Durata massima del video (con audio): 80 secondi Durata massima del video (senza audio): 120 secondi Numero massimo di video per prompt: 1 Tipi MIME supportati: `video/mpeg`, `video/mp4`
	Audio	Durata audio massima per prompt: 180 secondi Numero massimo di file audio per prompt: 1 Tipi MIME supportati: `audio/mp3`, `audio/wav`
Aree geografiche supportate	Disponibilità del modello	Globale: `global` Stati Uniti (multi-regione): `us` Europa (multi-regione): `eu`
Data del knowledge cutoff	Novembre 2025
Versioni	`gemini-embedding-2` Fase di lancio: disponibilità generale Data di rilascio: 22 aprile 2026 `gemini-embedding-2-preview` Fase di lancio: anteprima pubblica Data di rilascio: 10 marzo 2026

Embedding Gemini 2 Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Embedding Gemini 2