Gemini 3 Pro

Vista previa

Este producto o función está sujeto a los "Términos de las Ofertas de Acceso Previo a la Disponibilidad General" de la sección Términos Generales de los Servicios de los Términos Específicos de los Serviciosy a los Términos Adicionales para Productos de IA Generativa en Versión Preliminar. Puedes tratar datos personales para este producto o función tal y como se indica en la Adenda sobre Tratamiento de Datos de Cloud, de acuerdo con las obligaciones y restricciones descritas en el contrato en virtud del cual accedes a Google Cloud. Los productos y las funciones previos a la disponibilidad general están disponibles tal cual y pueden tener una compatibilidad y asistencia limitadas. Para obtener más información, consulta las descripciones de las fases de lanzamiento.

Gemini 3 Pro es nuestro modelo de Gemini más avanzado, capaz de resolver problemas complejos. Gemini 3 Pro puede comprender vastos conjuntos de datos y problemas complejos de diferentes fuentes de información, como texto, audio, imágenes, vídeo, PDFs e incluso repositorios de código completos, gracias a su ventana de contexto de 1 millón de tokens.

Cambios en la calidad

Al migrar de Gemini 2.5 Pro a Gemini 3 Pro, podrás disfrutar de mejoras significativas en el razonamiento de alto nivel, el cumplimiento de instrucciones complejas, el uso de herramientas, los casos prácticos de agentes y las funciones de contexto largo (como la interpretación de imágenes y documentos). Los modelos de Gemini 3 Pro no se han diseñado para priorizar la compatibilidad con casos prácticos de comprensión de audio o segmentación de imágenes. Para obtener resultados de alto rendimiento en esos casos prácticos, prueba a usar modelos creados específicamente para esas necesidades. En el caso de los gráficos, las tablas o los diagramas con mucha información o complicados, el modelo puede extraer información incorrectamente o interpretar mal los recursos proporcionados. Presentar la información clave de la forma más sencilla posible puede ayudarte a obtener el resultado que prefieras al trabajar con Gemini 3 Pro.

Cambios en el comportamiento

Gemini 3 Pro se ha diseñado para ofrecer una alta eficiencia y capacidad de acción. El modelo se ha entrenado para ofrecer respuestas concisas y directas, así como para intentar resolver la intención del usuario lo más rápido posible. Como el modelo se ha diseñado para priorizar la utilidad, puede que, en ocasiones, haga conjeturas cuando falte información o que priorice una respuesta satisfactoria sobre instrucciones estrictas. Este comportamiento se puede mitigar o modificar con peticiones. Para obtener más información y consultar las prácticas recomendadas, consulta el artículo Empezar a usar Gemini 3.

Nuevas funciones

Gemini 3 Pro incluye varias funciones nuevas para mejorar el rendimiento, el control y la fidelidad multimodal:

Nivel de reflexión: usa el parámetro thinking_level para controlar la cantidad de razonamiento interno que realiza el modelo (bajo o alto) para equilibrar la calidad de la respuesta, la complejidad del razonamiento, la latencia y el coste. El parámetro thinking_level sustituye a thinking_budget en los modelos de Gemini 3.
Resolución multimedia: usa el parámetro media_resolution (baja, media o alta) para controlar el procesamiento de la visión en las entradas multimodales, lo que influye en el uso de tokens y la latencia. Consulta Empezar a usar Gemini 3 para ver los ajustes de resolución predeterminados.
Firmas de pensamiento: la validación más estricta de las firmas de pensamiento mejora la fiabilidad de las llamadas a funciones de varias interacciones.
Respuestas de funciones multimodales: las respuestas de funciones ahora pueden incluir objetos multimodales, como imágenes y PDFs, además de texto.
Llamada de función de streaming: transmite argumentos de llamada de función parciales para mejorar la experiencia de usuario durante el uso de la herramienta.

Para obtener más información sobre cómo usar estas funciones, consulta el artículo Empieza a usar Gemini 3.

Probar en Vertex AI Ver en Model Garden (Vista previa) Desplegar aplicación de ejemplo

Nota: Para usar la función "Implementar aplicación de ejemplo", necesitas un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.

Especificaciones técnicas
ID del modelo	`gemini-3-pro-preview`
Entradas y salidas admitidas	Entradas: Texto, Código, Imágenes, Audio, Vídeo, PDF Salidas: Texto
Límites de tokens	Número máximo de tokens de entrada: 1.048.576 Número máximo de tokens de salida: 65.536
Funciones	Compatible Fundamentación con la Búsqueda de Google Ejecución de código Instrucciones del sistema Salida estructurada Llamadas a funciones Contar tokens Pensando Almacenamiento en caché de contexto implícito Almacenamiento en caché de contexto explícito Vertex AI RAG Engine Completaciones de chat No compatible Ajustes API Gemini Live
Tipos de uso	Compatible Capacidad de procesamiento aprovisionada Pago por uso estándar Predicción por lotes No compatible
	Imágenes	Número máximo de imágenes por petición: 900 Tamaño máximo de archivo por archivo para datos insertados o subidas directas a través de la consola: 7 MB Tamaño máximo de archivo por archivo de Google Cloud Storage: 30 MB Tokens de resolución predeterminados: 1120 Tipos MIME admitidos: `image/png`, `image/jpeg`, `image/webp`, `image/heic`, `image/heif`
	Documentos	Número máximo de archivos por petición: 900 Número máximo de páginas por archivo: 900 Tamaño máximo de archivo por archivo para las importaciones de la API o de Cloud Storage: 50 MB Tamaño máximo de archivo para las subidas directas a través de la consola: 7 MB Tokens de resolución predeterminados: 560 OCR para PDFs escaneados: No se usa de forma predeterminada Tipos MIME admitidos: `application/pdf` `text/plain`
	Vídeo	Duración máxima del vídeo (con audio): Aproximadamente 45 minutos Duración máxima del vídeo (sin audio): Aproximadamente 1 hora Número máximo de vídeos por petición: 10 Tokens de resolución predeterminados por fotograma: 70 Tipos MIME admitidos: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Duración máxima del audio por petición: Aproximadamente 8, 4 horas o hasta 1 millón de tokens Número máximo de archivos de audio por petición: 1 Comprensión del habla para: Resumir, transcribir y traducir audio Tipos MIME admitidos: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/ogg`, `audio/pcm`, `audio/wav`, `audio/webm`
	Valores predeterminados de los parámetros	Temperatura: 0,0-2,0 (1,0 de forma predeterminada) topP: 0,0-1,0 (valor predeterminado: 0,95) topK: 64 (fijo) candidateCount: de 1 a 8 (1 de forma predeterminada)
Regiones disponibles
	Disponibilidad del modelo Incluye las opciones Estándar de pago por uso y Capacidad de procesamiento aprovisionada.	Global Mundial
	Para obtener más información, consulta Implementaciones y endpoints.
Fecha de corte de conocimiento	Enero del 2025
Versiones	`gemini-3-pro-preview` Fase de lanzamiento: vista previa pública Fecha de lanzamiento: 18 de noviembre del 2025
Controles de seguridad
	Predicción online	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Predicción por lotes	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Ajustes	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Almacenamiento en caché de contexto	Residencia de datos CMEK Controles de Servicio de VPC AXT
	Para obtener más información, consulta Controles de seguridad.
Idiomas disponibles	Consulta los idiomas admitidos.
Precios	Consulta Precios.

Gemini 3 Pro Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Cambios en la calidad

Cambios en el comportamiento

Nuevas funciones

Gemini 3 Pro