Gemini 2.0 Flash

Gemini 2.0 Flash ofrece funciones de nueva generación y capacidades mejoradas diseñadas para la era de los agentes, como una velocidad superior, uso de herramientas integrado, generación multimodal y una ventana de contexto de 1 millón de tokens. Gemini 2.0 Flash mejora nuestro modelo Flash anterior y ofrece una calidad superior a velocidades similares.

2.0 Flash

Probar en Vertex AI Ver en Model Garden (Vista previa) Desplegar aplicación de ejemplo

Nota: Para usar la función "Implementar aplicación de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.
ID del modelo gemini-2.0-flash
Entradas y salidas admitidas
  • Entradas:
    Texto Código Imágenes Audio Vídeo
  • Salidas:
    Texto
Límites de tokens
  • Número máximo de tokens de entrada: 1.048.576
  • Número máximo de tokens de salida: 8192 (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Imágenes
  • Número máximo de imágenes por petición: 3000
  • Tamaño máximo de archivo por archivo para datos insertados o subidas directas a través de la consola: 7 MB
  • Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB
  • Número máximo de tokens por minuto (TPM) por proyecto:
    • Resolución de contenido multimedia alta, media o predeterminada:
      • EE. UU./Asia: 40 M
      • UE: 10 M
    • Resolución multimedia baja:
      • EE. UU./Asia: 10 M
      • UE: 2,6 M
  • Tipos MIME admitidos:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Número máximo de archivos por petición: 3000
  • Número máximo de páginas por archivo: 1000
  • Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB
  • Tamaño máximo de archivo para las subidas directas a través de la consola: 7 MB
  • Número máximo de tokens por minuto (TPM) por proyecto1:
    • EE. UU./Asia: 3,4 M
    • UE: 3,4 M
  • Tipos MIME admitidos:
    application/pdf text/plain
Vídeo
  • Duración máxima del vídeo (con audio): Aproximadamente 45 minutos
  • Duración máxima del vídeo (sin audio): Aproximadamente 1 hora
  • Número máximo de vídeos por petición: 10
  • Número máximo de tokens por minuto (TPM):
    • Resolución de contenido multimedia alta, media o predeterminada:
      • EE. UU./Asia: 38 M
      • UE: 10 M
    • Resolución multimedia baja:
      • EE. UU./Asia: 10 M
      • UE: 2,5 M
  • Tipos MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens
  • Número máximo de archivos de audio por petición: 1
  • Comprensión del habla para: Resumir, transcribir y traducir audio
  • Número máximo de tokens por minuto (TPM):
    • EE. UU./Asia: 3,5 M
    • UE: 3,5 M
  • Tipos MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

Incluye la opción de pago por uso estándar con niveles de uso y el rendimiento aprovisionado.

  • Global
    • Mundial
  • Estados Unidos
    • us-central1
    • us‑east1
    • us‑east4
    • us-east5
    • us-south1
    • us‑west1
    • us-west4
  • Europa
    • europe-central2
    • europe‑north1
    • europe-southwest1
    • europe‑west1
    • europe‑west4
    • europe-west8
    • europe-west9

Procesamiento de aprendizaje automático

  • Estados Unidos
    • Multirregional
  • Europa
    • Multirregional
Para obtener más información, consulta Implementaciones y endpoints.
Fecha de corte de conocimiento Junio del 2024
Versiones
  • gemini-2.0-flash-001
    • Fase de lanzamiento: GA
    • Fecha de lanzamiento: 5 de febrero del 2025
    • Fecha de retirada: 3 de marzo del 2026
Controles de seguridad
Predicción online
  • Residencia de datos
  • CMEK
  • Controles de Servicio de VPC
  • AXT
Predicción por lotes
  • Residencia de datos
  • CMEK
  • Controles de Servicio de VPC
  • AXT
Ajuste
  • Residencia de datos
  • CMEK
  • Controles de Servicio de VPC
  • AXT
Almacenamiento en caché de contexto
  • Residencia de datos
  • CMEK
  • Controles de Servicio de VPC
  • AXT
RAG Engine
  • Residencia de datos
  • CMEK
  • Controles de Servicio de VPC
  • AXT
Fundamentación con la Búsqueda de Google y con Google Maps
  • Residencia de datos
  • CMEK
  • Controles de Servicio de VPC
  • AXT
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.

API Live

Probar en Vertex AI

ID del modelo gemini-2.0-flash-live-preview-04-09
Entradas y salidas admitidas
  • Entradas:
    Audio Vídeo
  • Salidas:
    Audio
Límites de tokens
  • Número máximo de tokens de entrada: 32.768
  • Número máximo de tokens de salida: 8192 (valor predeterminado)
Funciones
Tipos de uso
Límite de tamaño de entrada 500 MB
Especificaciones técnicas
Vídeo
  • Duración máxima del vídeo (con audio): Aproximadamente 45 minutos
  • Duración máxima del vídeo (sin audio): Aproximadamente 1 hora
  • Número máximo de vídeos por petición: 10
  • Número máximo de tokens por minuto (TPM):
    • Resolución de contenido multimedia alta, media o predeterminada:
      • EE. UU./Asia: 37,9 M
      • UE: 9,5 M
    • Resolución multimedia baja:
      • EE. UU./Asia: 1 G
      • UE: 2,5 M
  • Tipos MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens
  • Número máximo de archivos de audio por petición: 1
  • Comprensión del habla para: Resumir, transcribir y traducir audio
  • Número máximo de tokens por minuto (TPM):
    • EE. UU./Asia: 1,7 M
    • UE: 0,4 M
  • Tipos MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

  • Estados Unidos
    • us-central1
Para obtener más información, consulta Implementaciones y endpoints.
Fecha de corte de conocimiento Junio del 2024
Versiones
  • gemini-2.0-flash-live-preview-04-09
    • Fase de lanzamiento: vista previa pública
    • Fecha de lanzamiento: 9 de abril del 2025
Controles de seguridad
Predicción online
  • Residencia de datos
  • CMEK
  • Controles de Servicio de VPC
  • AXT
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.