Embedding Gemini 2

Gemini Embedding 2 è il modello di generazione di embedding di Google ideale per attività complesse di recupero e analisi.

Gemini Embedding 2 accetta input multimodali per generare vettori a 3072 dimensioni. Accetta input di immagini, testo, documenti, audio e video e mappa semanticamente i vettori generati in uno spazio semantico unificato. In questo modo, puoi eseguire attività come la ricerca di un'immagine in base a una descrizione testuale.

Gemini Embedding 2 introduce diverse funzionalità per ottimizzare la qualità e la flessibilità degli incorporamenti:

  • Istruzioni personalizzate per l'attività:specificando le istruzioni per l'attività (ad esempio, task:code retrieval o task:search result), ottimizza gli incorporamenti per le relazioni previste e recupera risultati più accurati per l'obiettivo specifico.

  • Dimensione dei risultati regolabile:il modello genera un vettore float a 3072 dimensioni per impostazione predefinita. Tuttavia, puoi recuperare un output dimensionale più piccolo specificando il parametro output_dimensionality.

  • OCR di documenti:leggi l'OCR dagli input dei documenti.

  • Estrazione delle tracce audio: estrai le tracce audio dagli input video e alternale ai fotogrammi video.

Prova nella piattaforma agentica (anteprima) Esegui il deployment dell'app di esempio

Nota: per utilizzare la funzionalità "Deploy dell'app di esempio", devi disporre di un progetto Google Cloud con fatturazione e API Agent Platform abilitate.
ID modello gemini-embedding-2
Input e output supportati
  • Input:
    Testo, Immagini, Audio, Video, PDF
  • Output:
    Incorporamenti
Limiti di token
  • Token di input massimi: 8192
  • Numero massimo di token di output: N/A
Lunghezza massima della sequenza

8192 token

Dimensioni di output

Fino a 3072 (con supporto MRL)

Opzioni di consumo
Per saperne di più, consulta Opzioni di consumo.
Specifiche tecniche
Immagini
  • Numero massimo di immagini per prompt: 6
  • Dimensione massima dei file per i dati in linea o i caricamenti diretti tramite la console: Nessun limite
  • Dimensioni massime per file da Google Cloud Storage: Nessun limite
  • Numero massimo di immagini di output per prompt: N/A
  • Tipi MIME supportati:
    image/png, image/jpeg
Documenti
  • Numero massimo di file per prompt: 1
  • Numero massimo di pagine per file: 6
  • Dimensioni massime per file: N/A
  • Tipi MIME supportati:
    application/pdf
Video
  • Durata massima del video (con audio): 80 secondi
  • Durata massima del video (senza audio): 120 secondi
  • Numero massimo di video per prompt: 1
  • Tipi MIME supportati:
    video/mpeg, video/mp4
Audio
  • Durata audio massima per prompt: 180 secondi
  • Numero massimo di file audio per prompt: 1
  • Tipi MIME supportati:
    audio/mp3, audio/wav
Valori predefiniti dei parametri
Aree geografiche supportate

Disponibilità del modello

  • Globale
    • globale
  • Stati Uniti (multi-regione)
    • us
  • Europa (multi-regione)
    • eu
Per ulteriori informazioni, consulta Deployment ed endpoint.
Data del knowledge cutoff Novembre 2025
Versioni
  • gemini-embedding-2
    • Fase di lancio: disponibilità generale
    • Data di rilascio: 22 aprile 2026
  • gemini-embedding-2-preview
    • Fase di lancio: anteprima pubblica
    • Data di rilascio: 10 marzo 2026
Controlli di sicurezza
Per saperne di più, consulta Controlli di sicurezza.
Lingue supportate Consulta la sezione Lingue supportate.
Prezzi Vedi Prezzi.