Gemini 3 Flash

Gemini 3 Flash combina las capacidades de razonamiento de Gemini 3 Pro con los niveles de latencia, eficiencia y costo de la línea Flash. No solo permite realizar tareas cotidianas con un razonamiento mejorado, sino que también está diseñado para abordar los flujos de trabajo más complejos.

Gemini 3 Flash usa varias funciones nuevas para mejorar el rendimiento, el control y la fidelidad multimodal:

  • Nivel de pensamiento: Usa el parámetro thinking_level para controlar la cantidad de razonamiento interno que realiza el modelo (mínimo, bajo, medio o alto) para equilibrar la calidad de la respuesta, la complejidad del razonamiento, la latencia y el costo. El parámetro thinking_level reemplaza a thinking_budget para los modelos de Gemini 3.

    Para obtener detalles sobre los diferentes niveles de pensamiento, consulta Pensamiento.

  • Firmas de pensamiento: La validación más estricta de las firmas de pensamiento mejora la confiabilidad en las llamadas a funciones de varios turnos.

  • Resolución de medios: Usa el parámetro media_resolution (low, medium, high o ultra high) para controlar el procesamiento de visión de las entradas multimodales, lo que afecta el uso de tokens y la latencia. Consulta Cómo comenzar a usar Gemini 3 para conocer la configuración de resolución predeterminada.

    • El nivel de resolución de medios ultra alta solo está disponible para la modalidad IMAGE.
    • Los recuentos de tokens de PDF aparecerán en la modalidad IMAGE en lugar de la modalidad DOCUMENT en usage_metadata.
  • Respuestas de funciones multimodales: Las respuestas de funciones ahora pueden incluir objetos multimodales, como imágenes y PDFs, además de texto.

  • Llamadas a funciones de transmisión: Transmite argumentos parciales de llamadas a funciones para mejorar la experiencia del usuario durante el uso de herramientas.

Para obtener más información sobre cómo usar estas funciones, consulta Cómo comenzar a usar Gemini 3.

Probar en Vertex AI Ver en Model Garden (Vista previa) Implementar app de ejemplo

Nota: Para usar la función "Implementar app de ejemplo", necesitas un proyecto de Google Cloud con facturación y la API de Vertex AI habilitadas.
ID de modelo gemini-3-flash-preview
Entradas y salidas compatibles
  • Entradas:
    Texto, Código, Imágenes, Audio, Video, PDF
  • Resultados:
    Texto
Límites de tokens
  • Cantidad máxima de tokens de entrada: 1,048,576
  • Cantidad máxima de tokens de salida: 65,536
Funciones
Tipos de uso
Especificaciones técnicas
Imágenes
  • Cantidad máxima de imágenes por instrucción: 900
  • Tamaño máximo de archivo por archivo para los datos intercalados o las cargas directas a través de la consola: 7 MB
  • Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB
  • Tokens de resolución predeterminados: 1120
  • Tipos de MIME admitidos:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Cantidad máxima de archivos por instrucción: 900
  • Cantidad máxima de páginas por archivo: 900
  • Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB
  • Tamaño máximo de archivo para las cargas directas a través de la consola: 7 MB
  • Tokens de resolución predeterminados: 560
  • OCR para archivos PDF escaneados: No se usa de forma predeterminada
  • Tipos de MIME admitidos:
    application/pdf, text/plain
Video
  • Duración máxima del video (con audio): Aproximadamente 45 minutos
  • Duración máxima del video (sin audio): Aproximadamente 1 hora
  • Cantidad máxima de videos por instrucción: 10
  • Tokens de resolución predeterminados por fotograma: 70
  • Tipos de MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima de audio por instrucción: Aproximadamente 8.4 horas o hasta 1 millón de tokens
  • Cantidad máxima de archivos de audio por instrucción: 1
  • Comprensión del habla para: Resumen, transcripción y traducción de audio
  • Tipos de MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0.0 a 2.0 (predeterminado 1.0)
  • topP: 0.0 a 1.0 (predeterminado 0.95)
  • topK: 64 (fijo)
  • candidateCount: 1 a 8 (el valor predeterminado es 1)
Regiones admitidas

Disponibilidad del modelo

(Incluye el plan Estándar con pago por uso y la capacidad de procesamiento aprovisionada)

  • Global
    • global
Consulta Implementaciones y endpoints para obtener más información.
Fecha límite de conocimiento Enero de 2025
Versiones
  • gemini-3-flash-preview
    • Etapa de lanzamiento: Versión preliminar pública
    • Fecha de lanzamiento: 17 de diciembre de 2025
Controles de seguridad
Predicción en línea
  • Residencia de los datos
  • CMEK
  • VPC-SC
  • AXT
Predicción por lotes
  • Residencia de los datos
  • CMEK
  • VPC-SC
  • AXT
Ajuste
  • Residencia de los datos
  • CMEK
  • VPC-SC
  • AXT
Almacenamiento en caché del contexto
  • Residencia de los datos
  • CMEK
  • VPC-SC
  • AXT
Consulta Controles de seguridad para obtener más información.
Idiomas compatibles Consulta Idiomas admitidos.
Precios Consulta la sección de precios.