Gemini 3 Pro

Gemini 3 Pro es nuestro modelo de Gemini más avanzado, capaz de resolver problemas complejos. Gemini 3 Pro puede comprender vastos conjuntos de datos y problemas complejos de diferentes fuentes de información, como texto, audio, imágenes, vídeo, PDFs e incluso repositorios de código completos, gracias a su ventana de contexto de 1 millón de tokens.

Gemini 3 Pro incluye varias funciones nuevas para mejorar el rendimiento, el control y la fidelidad multimodal:

  • Nivel de reflexión: usa el parámetro thinking_level para controlar la cantidad de razonamiento interno que realiza el modelo (bajo o alto) para equilibrar la calidad de la respuesta, la complejidad del razonamiento, la latencia y el coste. El parámetro thinking_level sustituye a thinking_budget en los modelos de Gemini 3.
  • Resolución multimedia: usa el parámetro media_resolution (baja, media o alta) para controlar el procesamiento de la visión en las entradas multimodales, lo que influye en el uso de tokens y la latencia. Consulta Empezar a usar Gemini 3 para ver los ajustes de resolución predeterminados.
  • Firmas de pensamiento: la validación más estricta de las firmas de pensamiento mejora la fiabilidad de las llamadas a funciones de varias interacciones.
  • Respuestas de funciones multimodales: las respuestas de funciones ahora pueden incluir objetos multimodales, como imágenes y PDFs, además de texto.
  • Llamada de función de streaming: transmite argumentos de llamada de función parciales para mejorar la experiencia de usuario durante el uso de la herramienta.

Para obtener más información sobre cómo usar estas funciones, consulta el artículo Empieza a usar Gemini 3 Pro.

Probar en Vertex AI Ver en Model Garden (Vista previa) Desplegar aplicación de ejemplo

Nota: Para usar la función "Implementar aplicación de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.
ID del modelo gemini-3-pro-preview
Entradas y salidas admitidas
  • Entradas:
    Texto Código Imágenes Audio Vídeo PDF
  • Salidas:
    Texto
Límites de tokens
  • Número máximo de tokens de entrada: 1.048.576
  • Número máximo de tokens de salida: 65.536
Funciones
Tipos de uso
Especificaciones técnicas
Imágenes
  • Número máximo de imágenes por petición: 900
  • Tamaño máximo de archivo por archivo para datos insertados o subidas directas a través de la consola: 7 MB
  • Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB
  • Tokens de resolución predeterminados: 1120
  • Tipos MIME admitidos:
    image/png, image/jpeg, image/webp, image/heic, image/heif
Documentos
  • Número máximo de archivos por petición: 900
  • Número máximo de páginas por archivo: 900
  • Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB
  • Tamaño máximo de archivo para las subidas directas a través de la consola: 7 MB
  • Tokens de resolución predeterminados: 560
  • OCR para PDFs escaneados: No se usa de forma predeterminada
  • Tipos MIME admitidos:
    application/pdf text/plain
Vídeo
  • Duración máxima del vídeo (con audio): Aproximadamente 45 minutos
  • Duración máxima del vídeo (sin audio): Aproximadamente 1 hora
  • Número máximo de vídeos por petición: 10
  • Tokens de resolución predeterminados por fotograma: 70
  • Tipos MIME admitidos:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens
  • Número máximo de archivos de audio por petición: 1
  • Comprensión del habla para: Resumir, transcribir y traducir audio
  • Tipos MIME admitidos:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/ogg, audio/pcm, audio/wav, audio/webm
Valores predeterminados de los parámetros
  • Temperatura: 0,0-2,0 (1,0 de forma predeterminada)
  • topP: 0,0-1,0 (valor predeterminado: 0,95)
  • topK: 64 (fijo)
  • candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles

Disponibilidad del modelo

Incluye la cuota compartida dinámica y la capacidad de procesamiento aprovisionada.

  • Global
    • Mundial
Consulta más información sobre la residencia de los datos.
Fecha de corte de conocimiento Enero del 2025
Versiones
  • gemini-3-pro-preview
    • Fase de lanzamiento: vista previa pública
    • Fecha de lanzamiento: 18 de noviembre del 2025
Controles de seguridad
Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles Consulta los idiomas admitidos.
Precios Consulta Precios.