Modelos gerenciados da Vertex AI para MaaS

A Vertex AI oferece suporte a uma lista selecionada de modelos de parceiros e abertos como modelos gerenciados. Esses modelos podem ser usados com a Vertex AI como um modelo como serviço (MaaS) e são oferecidos como uma API gerenciada. Ao usar um modelo gerenciado, você continua enviando solicitações para endpoints da Vertex AI. Os modelos gerenciados não têm servidor, então não é necessário provisionar nem gerenciar infraestrutura.

Os modelos gerenciados podem ser descobertos usando o Model Garden. Também é possível implantar modelos usando o Model Garden. Para mais informações, consulte Conhecer modelos de IA no Model Garden.

Modelos de parceiros

Os seguintes modelos de parceiros são oferecidos como APIs gerenciadas no Model Garden da Vertex AI (MaaS):

Nome do modelo Modalidade Descrição Guia de início rápido
Claude Sonnet 4.5 Linguagem, visão O modelo de tamanho médio da Anthropic para agentes do mundo real, com recursos de programação, uso de computador, segurança cibernética e trabalho com arquivos de escritório, como planilhas. Card de modelo
Claude Opus 4.1 Linguagem, visão Líder do setor em programação. Ela oferece performance consistente em tarefas de longa duração que exigem esforço concentrado e milhares de etapas, expandindo significativamente o que os agentes de IA podem resolver. Ideal para impulsionar produtos e recursos de agentes de ponta. Card de modelo
Claude Haiku 4.5 Linguagem, visão O Claude Haiku 4.5 oferece desempenho quase de ponta para uma ampla variedade de casos de uso e se destaca como um dos melhores modelos de programação do mundo, com a velocidade e o custo certos para impulsionar produtos gratuitos e experiências de usuário de alto volume. Card de modelo
Claude Opus 4 Linguagem, visão O Claude Opus 4 oferece desempenho sustentado em tarefas longas que exigem esforço focado e milhares de etapas, expandindo significativamente o que os agentes de IA podem resolver. Card de modelo
Claude Sonnet 4 Linguagem, visão O modelo de tamanho médio da Anthropic com inteligência superior para usos de alto volume, como programação, pesquisa detalhada e agentes. Card de modelo
Claude 3.7 Sonnet da Anthropic Linguagem, visão Modelo líder do setor para programação e agentes de IA, além de ser o primeiro modelo Claude a oferecer raciocínio complexo. Card de modelo
Claude 3.5 Sonnet v2 da Anthropic Linguagem, visão O Claude 3.5 Sonnet atualizado é um modelo de ponta para tarefas de engenharia de software do mundo real e recursos de agente. O Claude 3.5 Sonnet oferece esses avanços pelo mesmo preço e velocidade que o antecessor. Card de modelo
Claude 3.5 Haiku da Anthropic Linguagem, visão O Claude 3.5 Haiku, a próxima geração do modelo mais rápido e econômico da Anthropic, é ideal para casos de uso em que a velocidade e a acessibilidade são importantes. Card de modelo
Haiku do Claude 3 da Anthropic Idioma O modelo de texto e visão mais rápido da Anthropic para respostas quase instantâneas a consultas básicas, voltado para experiências de IA perfeitas que imitam interações humanas. Card de modelo
Claude 3.5 Sonnet da Anthropic Idioma O Claude 3.5 Sonnet supera o Claude 3 Opus da Anthropic em uma ampla variedade de avaliações da Anthropic com a velocidade e o custo do modelo de nível médio da Anthropic, o Claude 3 Sonnet. Card de modelo
Jamba 1.5 Large (pré-lançamento) Idioma O Jamba 1.5 Large da AI21 Labs tem respostas de qualidade superior, capacidade de processamento e preços competitivos em comparação com outros modelos da mesma classe de tamanho. Card de modelo
Jamba 1.5 Mini (pré-lançamento) Idioma O Jamba 1.5 Mini da AI21 Labs tem equilíbrio entre qualidade, capacidade de processamento e custo. Card de modelo
Mistral Medium 3 Idioma O Mistral Medium 3 é um modelo versátil projetado para uma ampla variedade de tarefas, incluindo programação, raciocínio matemático, compreensão de documentos longos, resumo e diálogo. Card de modelo
OCR do Mistral (25/05) Linguagem, visão O OCR do Mistral (25.05) é uma API de reconhecimento óptico de caracteres para compreensão de documentos. O modelo compreende cada elemento de documentos, como mídia, texto, tabelas e equações. Card de modelo
Mistral Small 3.1 (25/03) Idioma O Mistral Small 3.1 (25/03) é a versão mais recente do modelo Small da Mistral, com recursos multimodais e comprimento de contexto estendido. Card de modelo
Mistral Large (24.11) Idioma O Mistral Large (24.11) é a próxima versão do modelo Mistral Large (24.07), agora com recursos aprimorados de raciocínio e chamada de função. Card de modelo
Codestral 2 Idioma, código O Codestral 2 é o modelo especializado em geração de código da Mistral, criado especificamente para preenchimento de lacunas (FIM) de alta precisão, que ajuda os desenvolvedores a escrever e interagir com código usando uma instrução compartilhada e um endpoint de API de conclusão. Card de modelo
Codestral (25.01) Código Um modelo de ponta projetado para geração de código, incluindo preenchimento no meio e preenchimento de código. Card de modelo

Modelos abertos

Os seguintes modelos abertos são oferecidos como APIs gerenciadas no Model Garden da Vertex AI (MaaS):

Nome do modelo Modalidade Descrição Guia de início rápido
gpt-oss 120B Idioma Um modelo de 120 bilhões de parâmetros que oferece alto desempenho em tarefas de raciocínio. Card de modelo
gpt-oss 20B Idioma Um modelo de 20 bilhões de parâmetros otimizado para eficiência e implantação em hardware de consumo e de borda. Card de modelo
Qwen3-Next-80B Thinking Idioma, código Um modelo da família Qwen3-Next, especializado em resolução de problemas complexos e raciocínio profundo. Card de modelo
Qwen3-Next-80B Instruct Idioma, código Um modelo da família Qwen3-Next, especializado em seguir comandos específicos. Card de modelo
Qwen3 Coder Idioma, código Um modelo de peso aberto desenvolvido para tarefas avançadas de desenvolvimento de software. Card de modelo
Qwen3 235B Idioma Um modelo de peso aberto com capacidade de "pensamento híbrido" para alternar entre raciocínio metódico e conversa rápida. Card de modelo
DeepSeek-V3.1 Idioma Modelo híbrido da DeepSeek que oferece suporte aos modos de raciocínio e sem raciocínio. Card de modelo
DeepSeek R1 (0528) Idioma A versão mais recente do modelo DeepSeek R1. Card de modelo
Llama 4 Maverick 17B-128E Linguagem, visão O maior e mais eficiente modelo Llama 4 com recursos de programação, raciocínio e imagem. O Llama 4 Maverick 17B-128E é um modelo multimodal que usa a arquitetura de combinação de especialistas (MoE) e fusão antecipada. Card de modelo
Llama 4 Scout 17B-16E Linguagem, visão O Llama 4 Scout 17B-16E oferece resultados de ponta para a classe de tamanho dele, superando gerações anteriores do Llama e outros modelos abertos e proprietários em vários comparativos. O Llama 4 Scout 17B-16E é um modelo multimodal que usa a arquitetura de combinação de especialistas (MoE) e fusão antecipada. Card de modelo
Llama 3.3 Idioma O Llama 3.3 é um modelo de 70 bilhões de parâmetros ajustado por instruções somente de texto que oferece desempenho aprimorado em relação ao Llama 3.1 70B e ao Llama 3.2 90B quando usado em aplicativos somente de texto. Além disso, para alguns aplicativos, o Llama 3.3 70B se aproxima do desempenho do Llama 3.1 405B. Card de modelo
Llama 3.2 (pré-lançamento) Linguagem, visão Um modelo multimodal de 90B de tamanho médio que dá suporte ao raciocínio de imagem, como análise de gráficos e legendas de imagens. Card de modelo
Llama 3.1 Idioma

Uma coleção de LLMs multilíngues otimizados para casos de uso de diálogo multilíngue, que superam muitos dos modelos de chat fechados e de código aberto em comparativos de mercado comuns.

O Llama 3.1 405B está em disponibilidade geral (GA).

O Llama 3.1 8B e o Llama 3.1 70B estão em pré-lançamento.

Card de modelo

A seguir