Gemini 3 Pro es el modelo de razonamiento más avanzado de Gemini, que permite resolver problemas complejos. Gemini 3 Pro puede comprender vastos conjuntos de datos y problemas desafiantes de diferentes fuentes de información, incluidos texto, audio, imágenes, video, archivos PDF e incluso repositorios de código completos con su ventana de contexto de 1 millón de tokens.
Cambios de calidad
Cuando migres de Gemini 2.5 Pro a Gemini 3 Pro, puedes esperar ver mejoras significativas en el razonamiento de alto nivel, el seguimiento de instrucciones complejas, el uso de herramientas, los casos de uso de agentes y mejores capacidades de contexto largo (incluida la comprensión de imágenes y documentos). Los modelos de Gemini 3 Pro no están diseñados para priorizar la compatibilidad con la comprensión de audio o los casos de uso de segmentación de imágenes. Para obtener un rendimiento alto en esos casos de uso, intenta usar modelos creados específicamente con esas necesidades en mente. En el caso de gráficos, tablas o diagramas complicados o con mucha información, el modelo a veces puede extraer información de forma incorrecta o malinterpretar los recursos proporcionados. Presentar la información clave de la manera más sencilla posible puede ayudar a garantizar el resultado preferido cuando se trabaja con Gemini 3 Pro.
Cambios en los comportamientos
Gemini 3 Pro está diseñado para brindar alta eficiencia y acción. El modelo se entrenó para proporcionar respuestas concisas y directas, y para intentar resolver la intención del usuario lo más rápido posible. Debido a que el modelo está diseñado para priorizar la utilidad, puede adivinar ocasionalmente cuando falta información o priorizar una respuesta satisfactoria por sobre las instrucciones estrictas. Este comportamiento se puede mitigar o modificar con instrucciones. Para obtener más información y conocer las prácticas recomendadas, consulta Cómo comenzar a usar Gemini 3.
Funciones nuevas
Gemini 3 Pro presenta varias funciones nuevas para mejorar el rendimiento, el control y la fidelidad multimodal:
- Nivel de razonamiento: Usa el parámetro
thinking_levelpara controlar la cantidad de razonamiento interno que realiza el modelo (low o high) para equilibrar la calidad de la respuesta, la complejidad del razonamiento, la latencia y el costo. El parámetrothinking_levelreemplaza athinking_budgetpara los modelos de Gemini 3. - Resolución de contenido multimedia: Usa el parámetro
media_resolution(low, medium o high) para controlar el procesamiento de visión para las entradas multimodales, lo que afecta el uso de tokens y la latencia. Consulta Cómo comenzar a usar Gemini 3 para conocer la configuración de resolución predeterminada. - Firmas de razonamiento: La validación más estricta de las firmas de razonamiento mejora la confiabilidad en las llamadas a funciones de varios turnos.
- Respuestas de funciones multimodales: Las respuestas de funciones ahora pueden incluir objetos multimodales, como imágenes y archivos PDF, además de texto.
- Llamada a funciones de transmisión: Transmite argumentos de llamadas a funciones parciales para mejorar la experiencia del usuario durante el uso de herramientas.
Para obtener más información sobre el uso de estas funciones, consulta Cómo comenzar a usar Gemini 3.
Probar en la vista de Agent Platform en Model Garden (versión preliminar) Implementar la app de ejemplo
| ID de modelo | gemini-3-pro-preview |
|
|---|---|---|
| Entradas y salidas admitidas |
|
|
| Límites de tokens |
|
|
| Funciones |
|
|
| Opciones de consumo | ||
| Consulta Opciones de consumo para obtener más información. | ||
| Especificaciones técnicas | ||
| Imágenes |
|
|
| Documentos |
|
|
| Video |
|
|
| Audio |
|
|
| Valores predeterminados de los parámetros |
|
|
| Regiones admitidas | ||
|
Disponibilidad del modelo |
|
|
| Consulta Implementaciones y extremos para obtener más información. | ||
| Fecha límite de conocimiento | Enero de 2025 | |
| Versiones |
|
|
| Idiomas compatibles | Consulta Idiomas compatibles. | |
| Precios | Consulta la sección de precios. | |