Gemini 2.0 Flash

Gemini 2.0 Flash ofrece funciones de última generación y capacidades mejoradas diseñadas para la era de los agentes, como una velocidad superior, uso de herramientas integrado, generación multimodal y una ventana de contexto de 1 millón de tokens. Gemini 2.0 Flash mejora nuestro modelo Flash anterior y ofrece una calidad superior a velocidades similares.

2.0 Flash

Probar en Vertex AI Ver en Model Garden (Vista previa) Desplegar aplicación de ejemplo

Nota: Para usar la función "Implementar aplicación de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.
ID del modelo gemini-2.0-flash
Entradas y salidas admitidas
  • Entradas:
    Texto, Código, Imágenes, Audio, Vídeo
  • Salidas:
    Texto
Límites de tokens
  • Número máximo de tokens de entrada: 1.048.576
  • Número máximo de tokens de salida: 8192 (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Imágenes
  • Número máximo de imágenes por petición: 3000
  • Tamaño máximo de archivo por archivo para datos insertados o subidas directas a través de la consola: 7 MB
  • Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB
  • Número máximo de tokens por minuto (TPM) por proyecto:
    • Resolución de contenido multimedia alta, media o predeterminada:
      • EE. UU./Asia: 40 M
      • UE: 10 M
    • Resolución multimedia baja:
      • EE. UU./Asia: 10 M
      • UE: 2,6 M
  • Tipos MIME admitidos:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Número máximo de archivos por petición: 3000
  • Número máximo de páginas por archivo: 1000
  • Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB
  • Tamaño máximo de archivo para las subidas directas a través de la consola: 7 MB
  • Número máximo de tokens por minuto (TPM) por proyecto1:
    • EE. UU./Asia: 3,4 M
    • UE: 3,4 M
  • Tipos MIME admitidos:
    application/pdf text/plain
Vídeo
  • Duración máxima del vídeo (con audio): Aproximadamente 45 minutos
  • Duración máxima del vídeo (sin audio): Aproximadamente 1 hora
  • Número máximo de vídeos por petición: 10
  • Número máximo de tokens por minuto (TPM):
    • Resolución de contenido multimedia alta, media o predeterminada:
      • EE. UU./Asia: 38 M
      • UE: 10 M
    • Resolución multimedia baja:
      • EE. UU./Asia: 10 M
      • UE: 2,5 M
  • Tipos MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens
  • Número máximo de archivos de audio por petición: 1
  • Comprensión del habla para: Resumir, transcribir y traducir audio
  • Número máximo de tokens por minuto (TPM):
    • EE. UU./Asia: 3,5 M
    • UE: 3,5 M
  • Tipos MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

Incluye la cuota compartida dinámica y la capacidad de procesamiento reservada.

  • Global
    • Mundial
  • Estados Unidos
    • us-central1
    • us‑east1
    • us‑east4
    • us-east5
    • us-south1
    • us‑west1
    • us-west4
  • Europa
    • europe-central2
    • europe‑north1
    • europe-southwest1
    • europe‑west1
    • europe‑west4
    • europe-west8
    • europe-west9

Procesamiento de aprendizaje automático

  • Estados Unidos
    • Multirregional
  • Europa
    • Multirregional
Para obtener más información, consulta Implementaciones y endpoints.
Fecha de corte de conocimiento Junio del 2024
Versiones
  • gemini-2.0-flash-001
    • Fase de lanzamiento: GA
    • Fecha de lanzamiento: 5 de febrero del 2025
    • Fecha de discontinuación: 5 de febrero del 2026
Controles de seguridad
Predicción online
  • Residencia de datos (en reposo) Admitido
  • Claves de encriptado gestionadas por el cliente (CMEK) Admitidas
  • Controles de Servicio de VPC Compatible
  • Transparencia de acceso (AXT) Compatible
Predicción por lotes
  • Residencia de datos (en reposo) Admitido
  • Claves de encriptado gestionadas por el cliente (CMEK) No compatible
  • Controles de Servicio de VPC Compatible
  • Transparencia de acceso (AXT) No compatible
Ajuste
  • Residencia de datos (en reposo) Admitido
  • Claves de encriptado gestionadas por el cliente (CMEK) Admitidas
  • Controles de Servicio de VPC Compatible
  • Transparencia de acceso (AXT) No compatible
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.

API Live

Probar en Vertex AI

ID del modelo gemini-2.0-flash-live-preview-04-09
Entradas y salidas admitidas
  • Entradas:
    Audio Vídeo
  • Salidas:
    Audio
Límites de tokens
  • Número máximo de tokens de entrada: 32.768
  • Número máximo de tokens de salida: 8192 (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Vídeo
  • Duración máxima del vídeo (con audio): Aproximadamente 45 minutos
  • Duración máxima del vídeo (sin audio): Aproximadamente 1 hora
  • Número máximo de vídeos por petición: 10
  • Número máximo de tokens por minuto (TPM):
    • Resolución de contenido multimedia alta, media o predeterminada:
      • EE. UU./Asia: 37,9 M
      • UE: 9,5 M
    • Resolución multimedia baja:
      • EE. UU./Asia: 1 G
      • UE: 2,5 M
  • Tipos MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens
  • Número máximo de archivos de audio por petición: 1
  • Comprensión del habla para: Resumir, transcribir y traducir audio
  • Número máximo de tokens por minuto (TPM):
    • EE. UU./Asia: 1,7 M
    • UE: 0,4 M
  • Tipos MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

  • Estados Unidos
    • us-central1
Para obtener más información, consulta Implementaciones y endpoints.
Fecha de corte de conocimiento Junio del 2024
Versiones
  • gemini-2.0-flash-live-preview-04-09
    • Fase de lanzamiento: vista previa pública
    • Fecha de lanzamiento: 9 de abril del 2025
Controles de seguridad
Predicción online
  • Residencia de datos (en reposo) No admitida
  • Claves de encriptado gestionadas por el cliente (CMEK) No compatible
  • Controles de Servicio de VPC Compatible
  • Transparencia de acceso (AXT) Compatible
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.