Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini 3 Pro

Vista previa

Este producto o función está sujeto a las "Condiciones de las Ofertas de la Fase Previa a la DG" de la sección de Términos Generales del Servicio de los Términos Específicos del Servicio y las Condiciones Adicionales para Productos en Versión Preliminar de IA Generativa. Puedes tratar datos personales para este producto o función, como se describe en el Anexo de Tratamiento de Datos de Cloud, sujeto a las obligaciones y restricciones que se describen en el acuerdo en virtud del cual accedes a Google Cloud. Los productos y las funciones de la fase previa a la DG están disponibles “tal como están” y pueden estar sujetos a asistencia limitada. Para obtener más información, consulta las descripciones de la etapa de lanzamiento.

Precaución: A partir del 26 de marzo de 2026, se suspenderá gemini-3-pro-preview. Ya no están disponibles la entrega de modelos ni la capacidad de procesamiento aprovisionada. Los proyectos nuevos y existentes deben usar gemini-3.1-pro-preview.

Gemini 3 Pro es el modelo de razonamiento más avanzado de Gemini, que permite resolver problemas complejos. Gemini 3 Pro puede comprender vastos conjuntos de datos y problemas desafiantes de diferentes fuentes de información, incluidos texto, audio, imágenes, video, archivos PDF e incluso repositorios de código completos con su ventana de contexto de 1 millón de tokens.

Cambios de calidad

Cuando migres de Gemini 2.5 Pro a Gemini 3 Pro, puedes esperar ver mejoras significativas en el razonamiento de alto nivel, el seguimiento de instrucciones complejas, el uso de herramientas, los casos de uso de agentes y mejores capacidades de contexto largo (incluida la comprensión de imágenes y documentos). Los modelos de Gemini 3 Pro no están diseñados para priorizar la compatibilidad con la comprensión de audio o los casos de uso de segmentación de imágenes. Para obtener un resultado de alto rendimiento en esos casos de uso, intenta usar modelos creados específicamente con esas necesidades en mente. En el caso de gráficos, tablas o diagramas complicados o con mucha información, el modelo a veces puede extraer información de forma incorrecta o malinterpretar los recursos proporcionados. Presentar la información clave de la manera más sencilla posible puede ayudar a garantizar el resultado preferido cuando se trabaja con Gemini 3 Pro.

Cambios en los comportamientos

Gemini 3 Pro está diseñado para brindar alta eficiencia y acción. El modelo se entrenó para proporcionar respuestas concisas y directas, y para intentar resolver la intención del usuario lo más rápido posible. Debido a que el modelo está diseñado para priorizar la utilidad, puede adivinar ocasionalmente cuando falta información o priorizar una respuesta satisfactoria por sobre las instrucciones estrictas. Este comportamiento se puede mitigar o modificar con instrucciones. Para obtener más información y conocer las prácticas recomendadas, consulta Cómo comenzar a usar Gemini 3.

Funciones nuevas

Gemini 3 Pro presenta varias funciones nuevas para mejorar el rendimiento, el control y la fidelidad multimodal:

Nivel de razonamiento: Usa el parámetro thinking_level para controlar la cantidad de razonamiento interno que realiza el modelo (low o high) para equilibrar la calidad de la respuesta, la complejidad del razonamiento, la latencia y el costo. El parámetro thinking_level reemplaza a thinking_budget para los modelos de Gemini 3.
Resolución de contenido multimedia: Usa el parámetro media_resolution(low, medium o high) para controlar el procesamiento de visión para las entradas multimodales, lo que afecta el uso de tokens y la latencia. Consulta Cómo comenzar a usar Gemini 3 para conocer la configuración de resolución predeterminada.
Firmas de razonamiento: La validación más estricta de las firmas de razonamiento mejora la confiabilidad en las llamadas a funciones de varios turnos.
Respuestas de funciones multimodales: Las respuestas de funciones ahora pueden incluir objetos multimodales, como imágenes y archivos PDF, además de texto.
Llamada a funciones de transmisión: Transmite argumentos de llamadas a funciones parciales para mejorar la experiencia del usuario durante el uso de herramientas.

Para obtener más información sobre el uso de estas funciones, consulta Cómo comenzar a usar Gemini 3.

Probar en la vista de Agent Platform en Model Garden (versión preliminar) Implementar la app de ejemplo

Nota: Para usar la función "Implementar la app de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API de Agent Platform habilitadas.

Especificaciones técnicas
ID de modelo	`gemini-3-pro-preview`
Entradas y salidas admitidas	Entradas: Texto, código, imágenes, audio, video, PDF Salidas: Texto
Límites de tokens	Cantidad máxima de tokens de entrada: 1,048,576 Cantidad máxima de tokens de salida: 65,536
Funciones	Admitido Grounding with Google Search Ejecución de código Instrucciones del sistema Salidas estructuradas Llamada a función Recuento de tokens Razonamiento Almacenamiento implícito en caché de contexto Almacenamiento explícito en caché de contexto Finalizaciones de chat No compatible Ajuste supervisado Ajuste continuo Ajuste de preferencias Puntos de control de ajuste API de Gemini Live
Opciones de consumo	Admitido Capacidad de procesamiento aprovisionada Pago por uso estándar Pago por uso flexible Pago por uso prioritario Inferencia por lotes No compatible
Opciones de consumo	Consulta Opciones de consumo para obtener más información.
	Imágenes	Cantidad máxima de imágenes por instrucción: 3,000 Tamaño máximo de archivo por archivo para datos intercalados o cargas directas a través de la consola: 7 MB Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB Tokens de resolución predeterminados: 1,120 Tipos de MIME admitidos: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Documentos	Cantidad máxima de archivos por instrucción: 3,000 Cantidad máxima de páginas por archivo: 3,000 Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB(application/pdf) o 7 MB(text/plain) Tamaño máximo de archivo por archivo para cargas directas a través de la consola: 7 MB Tokens de resolución predeterminados: 560 OCR para archivos PDF escaneados: No se usa de forma predeterminada Tipos de MIME admitidos: `application/pdf`, `text/plain`
	Video	Duración máxima del video (con audio): Aproximadamente 45 minutos Duración máxima del video (sin audio): Aproximadamente 1 hora Cantidad máxima de videos por instrucción: 10 Tokens de resolución predeterminados por fotograma: 70 Tipos de MIME admitidos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Duración máxima de audio por instrucción: Aproximadamente 8.4 horas o hasta 1 millón de tokens Cantidad máxima de archivos de audio por instrucción: 1 Comprensión de voz para: Resumen, transcripción y traducción de audio Tipos de MIME admitidos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valores predeterminados de los parámetros	Temperatura: 0.0-2.0 (predeterminado 1.0) topP: 0.0-1.0 (predeterminado 0.95) topK: 64 (cantidad fija) candidateCount: 1–8 (predeterminado 1)
Regiones admitidas
	Disponibilidad del modelo	Global global
	Consulta Implementaciones y extremos para obtener más información.
Fecha límite de conocimiento	Enero de 2025
Versiones	`gemini-3-pro-preview` Etapa de lanzamiento: Versión preliminar pública Fecha de lanzamiento: 18 de noviembre de 2025 Fecha de suspensión: 26 de marzo de 2026
Idiomas compatibles	Consulta Idiomas compatibles.
Precios	Consulta Precios.

Gemini 3 Pro Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Cambios de calidad

Cambios en los comportamientos

Funciones nuevas

Gemini 3 Pro