Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 3 Flash

Vista previa

Este producto o función está sujeto a las "Condiciones de la Oferta de la Fase Previa a la DG" en la sección Condiciones Generales del Servicio de las Condiciones Específicas del Servicio y las Condiciones Adicionales para Productos de IA Generativa en Versión Preliminar. Puedes tratar datos personales para este producto o función como se describe en el Anexo de Tratamiento de Datos de Cloud, sujeto a las obligaciones y restricciones que se describen en el acuerdo en virtud del cual accedes a Google Cloud. Los productos y las funciones de la fase previa a la DG están disponibles “tal como están” y pueden estar sujetos a asistencia limitada. Para obtener más información, consulta las descripciones de la etapa de lanzamiento.

Gemini 3 Flash combina las capacidades de razonamiento de Gemini 3 Pro con los niveles de latencia, eficiencia y costo de la línea Flash. No solo permite realizar tareas cotidianas con un razonamiento mejorado, sino que también está diseñado para abordar los flujos de trabajo de agentes más complejos.

Gemini 3 Flash usa varias funciones nuevas para mejorar el rendimiento, el control y la fidelidad multimodal:

Nivel de pensamiento: Usa el parámetro thinking_level para controlar la cantidad de razonamiento interno que realiza el modelo (mínimo, bajo, medio o alto) para equilibrar la calidad de la respuesta, la complejidad del razonamiento, la latencia y el costo. El parámetro thinking_level reemplaza a thinking_budget para los modelos de Gemini 3.

Nota: Si usaste un presupuesto de pensamiento de 0 con Gemini 2.5 Flash, establece tu nivel de pensamiento en MINIMAL para obtener una latencia y un costo similares. Sin embargo, aún debes controlar las firmas de pensamiento cuando uses el nivel de pensamiento mínimo.

Para obtener detalles sobre los diferentes niveles de pensamiento, consulta Pensamiento.
Firmas de pensamiento: La validación más estricta de las firmas de pensamiento mejora la confiabilidad en las llamadas a funciones de varios turnos.
Resolución de medios: Usa el parámetro media_resolution (low, medium, high o ultra high) para controlar el procesamiento de visión de las entradas multimodales, lo que afecta el uso de tokens y la latencia. Consulta Cómo comenzar a usar Gemini 3 para conocer la configuración de resolución predeterminada.
- El nivel de resolución de medios ultra alta solo está disponible para la modalidad IMAGE.
- Los recuentos de tokens de PDF aparecerán en la modalidad IMAGE en lugar de la modalidad DOCUMENT en usage_metadata.
Respuestas de funciones multimodales: Las respuestas de funciones ahora pueden incluir objetos multimodales, como imágenes y PDFs, además de texto.
Llamada a funciones de transmisión: Transmite argumentos parciales de llamadas a funciones para mejorar la experiencia del usuario durante el uso de herramientas.

Para obtener más información sobre el uso de estas funciones, consulta Cómo comenzar a usar Gemini 3.

Probar en Agent Platform Ver en Model Garden (Versión preliminar) Implementar app de ejemplo

Nota: Para usar la función "Implementar app de ejemplo", necesitas un proyecto de Google Cloud con facturación y la API de Agent Platform habilitada.

Especificaciones técnicas
ID de modelo	`gemini-3-flash-preview`
Entradas y salidas compatibles	Entradas: Texto, Código, Imágenes, Audio, Video, PDF Salidas: Texto
Límites de tokens	Cantidad máxima de tokens de entrada: 1,048,576 Cantidad máxima de tokens de salida: 65,536
Funciones	Admitido Grounding with Google Search Ejecución de código Instrucciones del sistema Salidas estructuradas Llamada a función Contar tokens Pensamiento Almacenamiento implícito de contexto en caché Almacenamiento explícito en caché del contexto Completado de chat Uso de la computadora Función de versión preliminar No compatible Ajuste supervisado Ajuste continuo Ajuste de preferencias Puntos de control de ajuste API de Gemini Live Content Credentials (C2PA)
Opciones de consumo	Admitido Capacidad de procesamiento aprovisionada Standard PayGo Flex PayGo PayGo prioritario Inferencia por lotes No compatible
Opciones de consumo	Consulta Opciones de consumo para obtener más información.
	Imágenes	Cantidad máxima de imágenes por instrucción: 3,000 Tamaño máximo de archivo por archivo para datos intercalados o cargas directas a través de la consola: 7 MB Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB Tokens de resolución predeterminados: 1120 Tipos de MIME admitidos: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Documentos	Cantidad máxima de archivos por instrucción: 3,000 Cantidad máxima de páginas por archivo: 3,000 Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB(application/pdf) o 7 MB(text/plain) Tamaño máximo de archivo para las cargas directas a través de la consola: 7 MB Tokens de resolución predeterminados: 560 OCR para archivos PDF escaneados: No se usa de forma predeterminada Tipos de MIME admitidos: `application/pdf`, `text/plain`
	Video	Duración máxima del video (con audio): Aproximadamente 45 minutos Duración máxima del video (sin audio): Aproximadamente 1 hora Cantidad máxima de videos por instrucción: 10 Tokens de resolución predeterminados por fotograma: 70 Tipos de MIME admitidos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Duración máxima de audio por instrucción: Aproximadamente 8.4 horas o hasta 1 millón de tokens Cantidad máxima de archivos de audio por instrucción: 1 Comprensión del habla para: Resumen, transcripción y traducción de audio Tipos de MIME admitidos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valores predeterminados de los parámetros	Temperatura: 0.0 a 2.0 (predeterminado 1.0) topP: 0.0 a 1.0 (predeterminado 0.95) topK: 64 (fijo) candidateCount: 1 a 8 (el valor predeterminado es 1)
Regiones admitidas
	Disponibilidad del modelo	Global global
	Consulta Implementaciones y extremos para obtener más información.
Fecha límite de conocimiento	Enero de 2025
Versiones	`gemini-3-flash-preview` Etapa de lanzamiento: Versión preliminar pública Fecha de lanzamiento: 17 de diciembre de 2025
Idiomas compatibles	Consulta los idiomas admitidos.
Precios	Consulta la sección de precios.

Gemini 3 Flash Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Gemini 3 Flash