Embedding do Gemini 2

O Gemini Embedding 2 é o modelo de geração de incorporações do Google ideal para tarefas complexas de recuperação e análise.

O Gemini Embedding 2 aceita entradas multimodais para gerar vetores de 3.072 dimensões. Ele aceita entradas de imagens, texto, documentos, áudio e vídeo e mapeia semanticamente os vetores gerados em um espaço semântico unificado. Isso permite realizar tarefas, como pesquisar uma imagem com base em uma descrição de texto.

O Gemini Embedding 2 apresenta vários recursos para otimizar a qualidade e a flexibilidade das incorporações:

  • Instruções de tarefa personalizadas:ao especificar instruções de tarefa (por exemplo, task:code retrieval ou task:search result), otimize os embeddings para as relações pretendidas e recupere resultados mais precisos para a meta específica.

  • Tamanho do resultado ajustável:por padrão, o modelo gera um vetor de ponto flutuante de 3.072 dimensões. No entanto, é possível recuperar uma saída dimensional menor especificando o parâmetro output_dimensionality.

  • OCR de documentos:lê o OCR de entradas de documentos.

  • Extração de faixa de áudio:extraia faixas de áudio de entradas de vídeo e intercale-as com frames de vídeo.

Testar na plataforma de agentes (prévia) Implantar um app de exemplo

Observação: para usar o recurso "Implantar app de exemplo", você precisa de um projeto na nuvem do Google Cloud com o faturamento e a API Agent Platform ativados.
ID do modelo gemini-embedding-2
Entradas e saídas compatíveis
  • Entradas:
    Texto, Imagens, Áudio, Vídeo, PDF
  • Saídas:
    Embeddings
Limites de tokens
  • Máximo de tokens de entrada: 8.192
  • Máximo de tokens de saída: N/A
Comprimento máximo da sequência

8.192 tokens

Dimensões de saída

Até 3.072 (com suporte a MRL)

Opções de consumo
Consulte Opções de consumo para mais informações.
Especificações técnicas
Imagens
  • Máximo de imagens por comando: 6
  • Tamanho máximo por arquivo para dados inline ou uploads diretos pelo console:
  • Tamanho máximo por arquivo do Google Cloud Storage: Sem limite
  • Número máximo de imagens de saída por comando: N/A
  • Tipos MIME compatíveis:
    image/png, image/jpeg
Documentos
  • Número máximo de arquivos por comando: 1
  • Número máximo de páginas por arquivo: 6
  • Tamanho máximo por arquivo: N/A
  • Tipos MIME compatíveis:
    application/pdf
Vídeo
  • Duração máxima do vídeo (com áudio): 80 segundos
  • Duração máxima do vídeo (sem áudio): 120 segundos
  • Número máximo de vídeos por comando: 1
  • Tipos MIME compatíveis:
    video/mpeg, video/mp4
Áudio
  • Duração máxima do áudio por comando: 180 segundos
  • Número máximo de arquivos de áudio por comando: 1
  • Tipos MIME compatíveis:
    audio/mp3, audio/wav
Padrões de parâmetros
Regiões compatíveis

Disponibilidade do modelo

Consulte Implantações e endpoints para mais informações.
Data limite de conhecimento Novembro de 2025
Versões
  • gemini-embedding-2
    • Etapa do lançamento: GA
    • Data de lançamento: 22 de abril de 2026
  • gemini-embedding-2-preview
    • Estágio de lançamento: pré-lançamento
    • Data de lançamento: 10 de março de 2026
Controles de segurança
Consulte Controles de segurança para mais informações.
Idiomas compatíveis Consulte Idiomas aceitos.
Preços Consulte a seção Preços.