Gemini Embedding 2

Gemini Embedding 2 es el modelo de generación de embeddings de Google ideal para tareas complejas de recuperación y análisis.

Gemini Embedding 2 acepta entradas multimodales para generar vectores de 3,072 dimensiones. Acepta imágenes, texto, documentos, audio y video como entradas, y asigna semánticamente los vectores generados a un espacio semántico unificado. Esto te permite realizar tareas, como buscar una imagen basada en una descripción de texto.

Gemini Embedding 2 presenta varias funciones para optimizar la calidad y la flexibilidad de la incorporación:

  • Instrucciones de tareas personalizadas: Si especificas instrucciones de tareas (por ejemplo, task:code retrieval o task:search result), optimizas las incorporaciones para las relaciones deseadas y recuperas resultados más precisos para el objetivo específico.

  • Tamaño del resultado ajustable: De forma predeterminada, el modelo genera un vector de números de punto flotante de 3,072 dimensiones. Sin embargo, puedes recuperar un resultado dimensional más pequeño si especificas el parámetro output_dimensionality.

  • OCR de documentos: Lee el OCR de las entradas de documentos.

  • Extracción de pistas de audio: Extrae pistas de audio de las entradas de video y las intercala con los fotogramas de video.

Para obtener más información sobre cómo usar Gemini Embedding 2, consulta Obtén incorporaciones multimodales.

Probar en Agent Platform (versión preliminar) Implementar app de ejemplo

Nota: Para usar la función "Implementar app de ejemplo", necesitas un proyecto de Google Cloud con facturación y la API de Agent Platform habilitada.
ID de modelo gemini-embedding-2
Entradas y salidas compatibles
  • Entradas:
    Texto, Imágenes, Audio, Video, PDF
  • Salidas:
    Incorporaciones
Límites de tokens
  • Cantidad máxima de tokens de entrada: 8,192
  • Cantidad máxima de tokens de salida: N/A
Longitud máxima de la secuencia

8,192 tokens

Dimensiones de salida

Hasta 3,072 (con compatibilidad con MRL)

Opciones de consumo
Consulta Opciones de consumo para obtener más información.
Especificaciones técnicas
Imágenes
  • Cantidad máxima de imágenes por instrucción: 6
  • Tamaño máximo de archivo por archivo para datos intercalados o cargas directas a través de la consola: Sin límite
  • Tamaño máximo de archivo por archivo de Google Cloud Storage: Sin límite
  • Cantidad máxima de imágenes de salida por instrucción: N/A
  • Tipos de MIME admitidos:
    image/png, image/jpeg, image/webp, image/bmp, image/heic, image/heif, image/avif
Documentos
  • Cantidad máxima de archivos por instrucción: 1
  • Cantidad máxima de páginas por archivo: 6
  • Tamaño máximo del archivo: N/A
  • Tipos de MIME admitidos:
    application/pdf
Video
  • Duración máxima del video (con audio): 80 segundos
  • Duración máxima del video (sin audio): 120 segundos
  • Cantidad máxima de videos por instrucción: 1
  • Tipos de MIME admitidos:
    video/mpeg, video/mp4
Audio
  • Duración máxima de audio por instrucción: 180 segundos
  • Cantidad máxima de archivos de audio por instrucción: 1
  • Tipos de MIME admitidos:
    audio/mp3, audio/wav
Valores predeterminados de los parámetros
Regiones admitidas

Disponibilidad del modelo

Consulta Implementaciones y extremos para obtener más información.
Fecha límite de conocimiento Noviembre de 2025
Versiones
  • gemini-embedding-2
    • Etapa de lanzamiento: DG
    • Fecha de lanzamiento: 22 de abril de 2026
  • gemini-embedding-2-preview
    • Etapa de lanzamiento: Versión preliminar pública
    • Fecha de lanzamiento: 10 de marzo de 2026
Controles de seguridad
Consulta Controles de seguridad para obtener más información.
Idiomas compatibles Consulta los idiomas admitidos.
Precios Consulta la sección de precios.