Gemini 2.0 Flash

Gemini 2.0 Flash ofrece funciones de nueva generación y capacidades mejoradas diseñadas para la era de los agentes, como una velocidad superior, uso de herramientas integrado, generación multimodal y una ventana de contexto de 1 millón de tokens. Gemini 2.0 Flash mejora nuestro modelo Flash anterior y ofrece una calidad superior a velocidades similares.

2.0 Flash

Probar en Vertex AI Ver en Model Garden (Vista previa) Desplegar aplicación de ejemplo

Nota: Para usar la función "Implementar aplicación de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.

Especificaciones técnicas
ID del modelo	`gemini-2.0-flash`
Entradas y salidas admitidas	Entradas: Texto Código Imágenes Audio Vídeo Salidas: Texto
Límites de tokens	Número máximo de tokens de entrada: 1.048.576 Número máximo de tokens de salida: 8192 (valor predeterminado)
Funciones	Compatible Fundamentación con la Búsqueda de Google Ejecución de código Ajustes Instrucciones del sistema Salida estructurada Llamadas a funciones Contar tokens Almacenamiento en caché de contexto explícito Vertex AI RAG Engine Completaciones de chat No compatible API Gemini Live Pensando Almacenamiento en caché de contexto implícito
Tipos de uso	Compatible Capacidad de procesamiento aprovisionada Pago por uso estándar con niveles de uso Predicción por lotes No compatible
Límite de tamaño de entrada	500 MB
	Imágenes	Número máximo de imágenes por petición: 3000 Tamaño máximo de archivo por archivo para datos insertados o subidas directas a través de la consola: 7 MB Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB Número máximo de tokens por minuto (TPM) por proyecto: Resolución de contenido multimedia alta, media o predeterminada: EE. UU./Asia: 40 M UE: 10 M Resolución multimedia baja: EE. UU./Asia: 10 M UE: 2,6 M Tipos MIME admitidos: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Documentos	Número máximo de archivos por petición: 3000 Número máximo de páginas por archivo: 1000 Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB Tamaño máximo de archivo para las subidas directas a través de la consola: 7 MB Número máximo de tokens por minuto (TPM) por proyecto1: EE. UU./Asia: 3,4 M UE: 3,4 M Tipos MIME admitidos: `application/pdf` `text/plain`
	Vídeo	Duración máxima del vídeo (con audio): Aproximadamente 45 minutos Duración máxima del vídeo (sin audio): Aproximadamente 1 hora Número máximo de vídeos por petición: 10 Número máximo de tokens por minuto (TPM): Resolución de contenido multimedia alta, media o predeterminada: EE. UU./Asia: 38 M UE: 10 M Resolución multimedia baja: EE. UU./Asia: 10 M UE: 2,5 M Tipos MIME admitidos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens Número máximo de archivos de audio por petición: 1 Comprensión del habla para: Resumir, transcribir y traducir audio Número máximo de tokens por minuto (TPM): EE. UU./Asia: 3,5 M UE: 3,5 M Tipos MIME admitidos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valores predeterminados de los parámetros	Temperatura: 0,0-2,0 (1,0 de forma predeterminada) topP: 0,0-1,0 (valor predeterminado: 0,95) topK: 64 (fijo) candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles
	Disponibilidad del modelo Incluye la opción de pago por uso estándar con niveles de uso y el rendimiento aprovisionado.	Global Mundial Estados Unidos us-central1 us‑east1 us‑east4 us-east5 us-south1 us‑west1 us-west4 Europa europe-central2 europe‑north1 europe-southwest1 europe‑west1 europe‑west4 europe-west8 europe-west9
	Procesamiento de aprendizaje automático	Estados Unidos Multirregional Europa Multirregional
	Para obtener más información, consulta Implementaciones y endpoints.
Fecha de corte de conocimiento	Junio del 2024
Versiones	`gemini-2.0-flash-001` Fase de lanzamiento: GA Fecha de lanzamiento: 5 de febrero del 2025 Fecha de retirada: 3 de marzo del 2026
Controles de seguridad
	Predicción online	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Predicción por lotes	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Ajustes	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Almacenamiento en caché de contexto	Residencia de datos CMEK Controles de Servicio de VPC AXT
	RAG Engine	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Fundamentación con la Búsqueda de Google y con Google Maps	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles	Consulta los idiomas admitidos.
Precios	Consulta Precios.

API Live

Probar en Vertex AI

Especificaciones técnicas
ID del modelo	`gemini-2.0-flash-live-preview-04-09`
Entradas y salidas admitidas	Entradas: Audio Vídeo Salidas: Audio
Límites de tokens	Número máximo de tokens de entrada: 32.768 Número máximo de tokens de salida: 8192 (valor predeterminado)
Funciones	Compatible Fundamentación con la Búsqueda de Google Ejecución de código Instrucciones del sistema Llamadas a funciones API Gemini Live No compatible Ajustes Salida estructurada Pensando Almacenamiento en caché de contexto implícito Almacenamiento en caché de contexto explícito Vertex AI RAG Engine
Tipos de uso	Compatible Pago por uso estándar No compatible Capacidad de procesamiento aprovisionada Predicción por lotes
Límite de tamaño de entrada	500 MB
	Vídeo	Duración máxima del vídeo (con audio): Aproximadamente 45 minutos Duración máxima del vídeo (sin audio): Aproximadamente 1 hora Número máximo de vídeos por petición: 10 Número máximo de tokens por minuto (TPM): Resolución de contenido multimedia alta, media o predeterminada: EE. UU./Asia: 37,9 M UE: 9,5 M Resolución multimedia baja: EE. UU./Asia: 1 G UE: 2,5 M Tipos MIME admitidos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens Número máximo de archivos de audio por petición: 1 Comprensión del habla para: Resumir, transcribir y traducir audio Número máximo de tokens por minuto (TPM): EE. UU./Asia: 1,7 M UE: 0,4 M Tipos MIME admitidos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valores predeterminados de los parámetros	Temperatura: 0,0-2,0 (1,0 de forma predeterminada) topP: 0,0-1,0 (valor predeterminado: 0,95) topK: 64 (fijo) candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles
	Disponibilidad del modelo	Estados Unidos us-central1
	Para obtener más información, consulta Implementaciones y endpoints.
Fecha de corte de conocimiento	Junio del 2024
Versiones	`gemini-2.0-flash-live-preview-04-09` Fase de lanzamiento: vista previa pública Fecha de lanzamiento: 9 de abril del 2025
Controles de seguridad
	Predicción online	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles	Consulta los idiomas admitidos.
Precios	Consulta Precios.

Gemini 2.0 Flash Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

2.0 Flash

API Live

Gemini 2.0 Flash