Gemini 3 Flash

Gemini 3 Flash combina las capacidades de razonamiento de Gemini 3 Pro con los niveles de latencia, eficiencia y costo de la línea Flash. No solo permite realizar tareas cotidianas con un razonamiento mejorado, sino que también está diseñado para abordar los flujos de trabajo de agentes más complejos.

Gemini 3 Flash usa varias funciones nuevas para mejorar el rendimiento, el control y la fidelidad multimodal:

  • Nivel de razonamiento: Usa el parámetro thinking_level para controlar la cantidad de razonamiento interno que realiza el modelo (minimal, low, medium o high) para equilibrar la calidad de la respuesta, la complejidad del razonamiento, la latencia y el costo. El parámetro thinking_level reemplaza a thinking_budget para los modelos de Gemini 3.

    Para obtener detalles sobre los diferentes niveles de razonamiento, consulta Razonamiento.

  • Firmas de razonamiento: La validación más estricta de las firmas de razonamiento mejora la confiabilidad en las llamadas a funciones de varios turnos.

  • Resolución de contenido multimedia: Usa el parámetro media_resolution (low, medium, high o ultra high) para controlar el procesamiento de visión para las entradas multimodales, lo que afecta el uso de tokens y la latencia. Consulta Comienza a usar Gemini 3 para conocer la configuración de resolución predeterminada.

    • El nivel de resolución de contenido multimedia ultra high solo está disponible para la modalidad IMAGE.
    • Los recuentos de tokens de PDF aparecerán en la modalidad IMAGE en lugar de la modalidad DOCUMENT en usage_metadata.
  • Respuestas de funciones multimodales: Las respuestas de funciones ahora pueden incluir objetos multimodales, como imágenes y PDFs, además de texto.

  • Llamada a función de transmisión: Transmite argumentos de llamadas a funciones parciales para mejorar la experiencia del usuario durante el uso de herramientas.

Para obtener más información sobre el uso de estas funciones, consulta Comienza a usar Gemini 3.

Probar en la vista de Agent Platform en Model Garden (versión preliminar) Implementar la app de ejemplo

Nota: Para usar la función "Implementar la app de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API de Agent Platform habilitadas.
ID de modelo gemini-3-flash-preview
Entradas y salidas admitidas
  • Entradas:
    Texto, código, imágenes, audio, video y PDF
  • Salidas:
    Texto
Límites de tokens
  • Cantidad máxima de tokens de entrada: 1,048,576
  • Cantidad máxima de tokens de salida: 65,536
Funciones
Opciones de consumo
Consulta Opciones de consumo para obtener más información.
Especificaciones técnicas
Imágenes
  • Cantidad máxima de imágenes por instrucción: 3,000
  • Tamaño máximo de archivo por archivo para datos intercalados o cargas directas a través de la consola: 7 MB
  • Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB
  • Tokens de resolución predeterminados: 1,120
  • Tipos de MIME admitidos:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Cantidad máxima de archivos por instrucción: 3,000
  • Cantidad máxima de páginas por archivo: 3,000
  • Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB(application/pdf) o 7 MB(text/plain)
  • Tamaño máximo de archivo por archivo para cargas directas a través de la consola: 7 MB
  • Tokens de resolución predeterminados: 560
  • OCR para PDFs escaneados: No se usa de forma predeterminada
  • Tipos de MIME admitidos:
    application/pdf, text/plain
Video
  • Duración máxima del video (con audio): Aproximadamente 45 minutos
  • Duración máxima del video (sin audio): Aproximadamente 1 hora
  • Cantidad máxima de videos por instrucción: 10
  • Tokens de resolución predeterminados por fotograma: 70
  • Tipos de MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima de audio por instrucción: Aproximadamente 8.4 horas o hasta 1 millón de tokens
  • Cantidad máxima de archivos de audio por instrucción: 1
  • Comprensión de voz para: Resumen, transcripción y traducción de audio
  • Tipos de MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0.0-2.0 (predeterminado 1.0)
  • topP: 0.0-1.0 (predeterminado 0.95)
  • topK: 64 (cantidad fija)
  • candidateCount: 1–8 (predeterminado 1)
Regiones admitidas

Disponibilidad del modelo

  • Global
    • global
Consulta Implementaciones y extremos para obtener más información.
Fecha límite de conocimiento Enero de 2025
Versiones
  • gemini-3-flash-preview
    • Etapa de lanzamiento: Versión preliminar pública
    • Fecha de lanzamiento: 17 de diciembre de 2025
Idiomas compatibles Consulta Idiomas compatibles.
Precios Consulta la sección de precios.