Embedding Gemini 2

Gemini Embedding 2 è il modello di generazione di incorporamenti di Google ideale per attività complesse di recupero e analisi.

Gemini Embedding 2 accetta input multimodali per generare vettori a 3072 dimensioni. Accetta input di immagini, testo, documenti, audio e video e mappa semanticamente i vettori generati in uno spazio semantico unificato. In questo modo puoi eseguire attività come la ricerca di un'immagine in base a una descrizione testuale.

Gemini Embedding 2 introduce diverse funzionalità per ottimizzare la qualità e la flessibilità degli incorporamenti:

  • Istruzioni per le attività personalizzate: specificando le istruzioni per le attività (ad esempio, task:code retrieval o task:search result), puoi ottimizzare gli incorporamenti per le relazioni previste e recuperare risultati più precisi per l'obiettivo specifico.

  • Dimensioni dei risultati regolabili: per impostazione predefinita, il modello genera un vettore float a 3072 dimensioni. Tuttavia, puoi recuperare un output con dimensioni inferiori specificando il parametro output_dimensionality.

  • OCR dei documenti: leggi l'OCR dagli input dei documenti.

  • Estrazione delle tracce audio: estrai le tracce audio dagli input video e intervallale con i fotogrammi video.

Prova in Agent Platform (anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Esegui il deployment dell'app di esempio", devi disporre di un progetto Google Cloud con la fatturazione e l'API Agent Platform abilitate.
ID modello gemini-embedding-2
Input e output supportati
  • Input:
    Testo, Immagini, Audio, Video, PDF
  • Output:
    incorporamenti
Limiti di token
  • Numero massimo di token di input: 8192
  • Numero massimo di token di output: N/A
Lunghezza massima della sequenza

8192 token

Dimensioni di output

Fino a 3072 (con supporto MRL)

Opzioni di consumo
Per ulteriori informazioni, consulta Opzioni di consumo.
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 6
  • Dimensione massima dei file per i dati in linea o i caricamenti diretti tramite la console: Nessun limite
  • Dimensione massima dei file da Google Cloud Storage: nessun limite
  • Numero massimo di immagini di output per prompt: N/A
  • Tipi MIME supportati:
    image/png, image/jpeg
Documenti
  • Numero massimo di file per prompt: 1
  • Numero massimo di pagine per file: 6
  • Dimensione massima dei file: N/A
  • Tipi MIME supportati:
    application/pdf
Video
  • Durata massima del video (con audio): 80 secondi
  • Durata massima del video (senza audio): 120 secondi
  • Numero massimo di video per prompt: 1
  • Tipi MIME supportati:
    video/mpeg, video/mp4
Audio
  • Durata massima dell'audio per prompt: 180 secondi
  • Numero massimo di file audio per prompt: 1
  • Tipi MIME supportati:
    audio/mp3, audio/wav
Valori predefiniti dei parametri
Aree geografiche supportate

Disponibilità del modello

Per ulteriori informazioni, consulta Deployment ed endpoint.
Data di knowledge cutoff Novembre 2025
Versioni
  • gemini-embedding-2
    • Fase di avvio: GA
    • Data di rilascio: 22 aprile 2026
  • gemini-embedding-2-preview
    • Fase di avvio: anteprima pubblica
    • Data di rilascio: 10 marzo 2026
Controlli di sicurezza
Per ulteriori informazioni, consulta Controlli di sicurezza.
Lingue supportate Consulta Lingue supportate.
Prezzi Consulta Prezzi.