Gemini Embedding 2

Gemini Embedding 2 es el modelo de generación de embeddings de Google ideal para tareas complejas de recuperación y análisis.

Gemini Embedding 2 acepta entradas multimodales para generar vectores de 3,072 dimensiones. Acepta imágenes, texto, documentos, audio y video como entradas, y asigna semánticamente los vectores generados a un espacio semántico unificado. Esto te permite realizar tareas, como buscar una imagen basada en una descripción de texto.

Gemini Embedding 2 presenta varias funciones para optimizar la calidad y la flexibilidad de las incorporaciones:

  • Instrucciones de tareas personalizadas: Si especificas instrucciones de tareas (por ejemplo, task:code retrieval o task:search result), optimizas las incorporaciones para las relaciones deseadas y recuperas resultados más precisos para el objetivo específico.

  • Tamaño del resultado ajustable: De forma predeterminada, el modelo genera un vector de números de punto flotante de 3,072 dimensiones. Sin embargo, puedes recuperar un resultado dimensional más pequeño si especificas el parámetro output_dimensionality.

  • OCR de documentos: Lee el OCR de las entradas de documentos.

  • Extracción de pistas de audio: Extrae pistas de audio de las entradas de video y las intercala con los fotogramas de video.

Probar en Agent Platform (vista previa) Implementar app de ejemplo

Nota: Para usar la función "Implementar app de ejemplo", necesitas un proyecto de Google Cloud con facturación y la API de Agent Platform habilitadas.
ID de modelo gemini-embedding-2
Entradas y salidas compatibles
  • Entradas:
    Texto, Imágenes, Audio, Video, PDF
  • Salidas:
    Incorporaciones
Límites de tokens
  • Cantidad máxima de tokens de entrada: 8,192
  • Cantidad máxima de tokens de salida: N/A
Longitud máxima de la secuencia

8,192 tokens

Dimensiones de salida

Hasta 3,072 (con compatibilidad con MRL)

Opciones de consumo
Consulta Opciones de consumo para obtener más información.
Especificaciones técnicas
Imágenes
  • Cantidad máxima de imágenes por instrucción: 6
  • Tamaño máximo de archivo por archivo para datos intercalados o cargas directas a través de la consola: Sin límite
  • Tamaño máximo de archivo por archivo de Google Cloud Storage: Sin límite
  • Cantidad máxima de imágenes de salida por instrucción: N/A
  • Tipos de MIME admitidos:
    image/png, image/jpeg
Documentos
  • Cantidad máxima de archivos por instrucción: 1
  • Cantidad máxima de páginas por archivo: 6
  • Tamaño máximo del archivo: N/A
  • Tipos de MIME admitidos:
    application/pdf
Video
  • Duración máxima del video (con audio): 80 segundos
  • Duración máxima del video (sin audio): 120 segundos
  • Cantidad máxima de videos por instrucción: 1
  • Tipos de MIME admitidos:
    video/mpeg, video/mp4
Audio
  • Duración máxima de audio por instrucción: 180 segundos
  • Cantidad máxima de archivos de audio por instrucción: 1
  • Tipos de MIME admitidos:
    audio/mp3, audio/wav
Valores predeterminados de los parámetros
Regiones admitidas

Disponibilidad del modelo

Consulta Implementaciones y endpoints para obtener más información.
Fecha límite de conocimiento Noviembre de 2025
Versiones
  • gemini-embedding-2
    • Etapa de lanzamiento: DG
    • Fecha de lanzamiento: 22 de abril de 2026
  • gemini-embedding-2-preview
    • Etapa de lanzamiento: Versión preliminar pública
    • Fecha de lanzamiento: 10 de marzo de 2026
Controles de seguridad
Consulta Controles de seguridad para obtener más información.
Idiomas compatibles Consulta los idiomas admitidos.
Precios Consulta la sección de precios.