Vertex AI admite una lista seleccionada de modelos de partners y de código abierto como modelos gestionados. Estos modelos se pueden usar con Vertex AI como modelo como servicio (MaaS) y se ofrecen como una API gestionada. Cuando usas un modelo gestionado, sigues enviando tus solicitudes a los endpoints de Vertex AI. Los modelos gestionados no tienen servidor, por lo que no es necesario aprovisionar ni gestionar la infraestructura.
Los modelos gestionados se pueden descubrir mediante Model Garden. También puedes desplegar modelos con Model Garden. Para obtener más información, consulta Descubrir modelos de IA en Model Garden.
Modelos de partners
Los siguientes modelos de partners se ofrecen como APIs gestionadas en Vertex AI Model Garden (MaaS):
Nombre del modelo | Modalidad | Descripción | Guía de inicio rápido |
---|---|---|---|
Claude Sonnet 4.5 | Idioma, visión | Modelo de tamaño medio de Anthropic para potenciar agentes del mundo real, con funciones de programación, uso de ordenadores, ciberseguridad y trabajo con archivos de oficina, como hojas de cálculo. | Tarjeta de modelo |
Claude Opus 4.1 | Idioma, visión | Líder del sector en programación. Ofrece un rendimiento constante en tareas de larga duración que requieren un esfuerzo concentrado y miles de pasos, lo que amplía significativamente lo que pueden resolver los agentes de IA. Ideal para potenciar los productos y las funciones de los agentes de vanguardia. | Tarjeta de modelo |
Claude Haiku 4.5 | Idioma, visión | Claude Haiku 4.5 ofrece un rendimiento casi de vanguardia para una amplia gama de casos prácticos y destaca como uno de los mejores modelos de programación del mundo, con la velocidad y el coste adecuados para potenciar productos gratuitos y experiencias de usuario de gran volumen. | Tarjeta de modelo |
Claude Opus 4 | Idioma, visión | Claude Opus 4 ofrece un rendimiento sostenido en tareas de larga duración que requieren un esfuerzo concentrado y miles de pasos, lo que amplía significativamente lo que pueden resolver los agentes de IA. | Tarjeta de modelo |
Claude Sonnet 4 | Idioma, visión | Modelo de tamaño medio de Anthropic con una inteligencia superior para usos de gran volumen, como programación, investigación exhaustiva y agentes. | Tarjeta de modelo |
Claude 3.7 Sonnet de Anthropic | Idioma, visión | Modelo líder del sector para programar y potenciar agentes de IA. Es el primer modelo de Claude que ofrece un tiempo de reflexión ampliado. | Tarjeta de modelo |
Claude 3.5 Sonnet v2 de Anthropic | Idioma, visión | La versión mejorada de Claude 3.5 Sonnet es un modelo de vanguardia para tareas de ingeniería de software del mundo real y funciones de agentes. Claude 3.5 Sonnet ofrece estos avances al mismo precio y velocidad que su predecesor. | Tarjeta de modelo |
Claude 3.5 Haiku de Anthropic | Idioma, visión | Claude 3.5 Haiku, la nueva generación del modelo más rápido y rentable de Anthropic, es ideal para casos prácticos en los que la velocidad y la asequibilidad son importantes. | Tarjeta de modelo |
Claude 3 Haiku de Anthropic | Idioma | El modelo de visión y texto más rápido de Anthropic para responder casi instantáneamente a consultas básicas, con el objetivo de ofrecer experiencias de IA fluidas que imiten las interacciones humanas. | Tarjeta de modelo |
Claude 3.5 Sonnet de Anthropic | Idioma | Claude 3.5 Sonnet supera a Claude 3 Opus de Anthropic en una amplia gama de evaluaciones de Anthropic y con la velocidad y el coste del modelo de gama media de Anthropic, Claude 3 Sonnet. | Tarjeta de modelo |
Jamba 1.5 Large (versión preliminar) | Idioma | Jamba 1.5 Large de AI21 Labs se ha diseñado para ofrecer respuestas de calidad superior, un alto rendimiento y precios competitivos en comparación con otros modelos de su clase. | Tarjeta de modelo |
Jamba 1.5 Mini (vista previa) | Idioma | Jamba 1.5 Mini de AI21 Labs ofrece un buen equilibrio entre calidad, rendimiento y bajo coste. | Tarjeta de modelo |
Mistral Medium 3 | Idioma | Mistral Medium 3 es un modelo versátil diseñado para una amplia gama de tareas, como programación, razonamiento matemático, comprensión de documentos extensos, resúmenes y diálogos. | Tarjeta de modelo |
Mistral OCR (25.05) | Idioma, visión | Mistral OCR (25.05) es una API de reconocimiento óptico de caracteres para comprender documentos. El modelo comprende cada elemento de los documentos, como contenido multimedia, texto, tablas y ecuaciones. | Tarjeta de modelo |
Mistral Small 3.1 (25.03) | Idioma | Mistral Small 3.1 (25.03) es la versión más reciente del modelo Small de Mistral, que incluye funciones multimodales y una longitud de contexto ampliada. | Tarjeta de modelo |
Mistral Large (24.11) | Idioma | Mistral Large (24.11) es la siguiente versión del modelo Mistral Large (24.07), que ahora ofrece mejores funciones de razonamiento y de llamada de funciones. | Tarjeta de modelo |
Codestral 2 | Idioma, código | Codestral 2 es el modelo especializado en generación de código de Mistral, creado específicamente para completar con alta precisión la parte central de un texto (FIM), lo que ayuda a los desarrolladores a escribir e interactuar con el código a través de un endpoint de API de instrucciones y finalizaciones compartido. | Tarjeta de modelo |
Codestral (25.01) | Código | Un modelo de vanguardia diseñado para la generación de código, incluida la función de rellenar huecos y la finalización de código. | Tarjeta de modelo |
Modelos abiertos
Los siguientes modelos abiertos se ofrecen como APIs gestionadas en Vertex AI Model Garden (MaaS):
Nombre del modelo | Modalidad | Descripción | Guía de inicio rápido |
---|---|---|---|
gpt-oss 120B | Idioma | Un modelo de 120.000 millones de parámetros que ofrece un alto rendimiento en tareas de razonamiento. | Tarjeta de modelo |
gpt-oss 20B | Idioma | Un modelo de 20.000 millones de parámetros optimizado para la eficiencia y el despliegue en hardware de consumo y periférico. | Tarjeta de modelo |
Qwen3-Next-80B Thinking | Idioma, código | Un modelo de la familia Qwen3-Next, especializado en la resolución de problemas complejos y el razonamiento profundo. | Tarjeta de modelo |
Qwen3-Next-80B Instruct | Idioma, código | Un modelo de la familia Qwen3-Next, especializado en seguir comandos específicos. | Tarjeta de modelo |
Qwen3 Coder | Idioma, código | Un modelo de peso abierto desarrollado para tareas avanzadas de desarrollo de software. | Tarjeta de modelo |
Qwen3 235B | Idioma | Un modelo de peso abierto con una capacidad de "pensamiento híbrido" para alternar entre el razonamiento metódico y la conversación rápida. | Tarjeta de modelo |
DeepSeek-V3.1 | Idioma | El modelo híbrido de DeepSeek, que admite tanto el modo de reflexión como el modo sin reflexión. | Tarjeta de modelo |
DeepSeek R1 (0528) | Idioma | La versión más reciente del modelo DeepSeek R1 de DeepSeek. | Tarjeta de modelo |
Llama 4 Maverick 17B-128E | Idioma, visión | El modelo de Llama 4 más grande y potente, que ofrece funciones de programación, razonamiento e imagen. Llama 4 Maverick 17B-128E es un modelo multimodal que usa la arquitectura de Mixture-of-Experts (MoE) y la fusión temprana. | Tarjeta de modelo |
Llama 4 Scout 17B-16E | Idioma, visión | Llama 4 Scout 17B-16E ofrece resultados de vanguardia para su clase de tamaño, superando a las generaciones anteriores de Llama y a otros modelos abiertos y propietarios en varias comparativas. Llama 4 Scout 17B-16E es un modelo multimodal que usa la arquitectura de Mixture-of-Experts (MoE) y la fusión temprana. | Tarjeta de modelo |
Llama 3.3 | Idioma | Llama 3.3 es un modelo de 70.000 millones de parámetros de solo texto ajustado para instrucciones que ofrece un rendimiento mejorado en comparación con Llama 3.1 70B y Llama 3.2 90B cuando se usa en aplicaciones de solo texto. Además, en algunas aplicaciones, Llama 3.3 70B se acerca al rendimiento de Llama 3.1 405B. | Tarjeta de modelo |
Llama 3.2 (vista previa) | Idioma, visión | Un modelo multimodal de tamaño medio con 90.000 millones de parámetros que puede interpretar imágenes, como analizar gráficos y generar descripciones de imágenes. | Tarjeta de modelo |
Llama 3.1 | Idioma |
Una colección de LLMs multilingües optimizados para casos prácticos de diálogo multilingüe, que superan a muchos de los modelos de chat de código abierto y cerrados disponibles en las métricas comunes del sector. Llama 3.1 405B está disponible para el público general. Llama 3.1 8B y Llama 3.1 70B están en versión preliminar. |
Tarjeta de modelo |
Siguientes pasos
- Consulta más información sobre los modelos abiertos de Vertex AI para MaaS.
- Consulta cómo llamar a APIs de modelos abiertos.