Modelos gerenciados da Vertex AI para MaaS

A Vertex AI oferece suporte a uma lista selecionada de modelos de parceiros e abertos como modelos gerenciados. Esses modelos podem ser usados com a Vertex AI como um modelo como serviço (MaaS) e são oferecidos como uma API gerenciada. Ao usar um modelo gerenciado, você continua enviando solicitações para endpoints da Vertex AI. Os modelos gerenciados não têm servidor, então não é necessário provisionar nem gerenciar infraestrutura.

Os modelos gerenciados podem ser descobertos usando o Model Garden. Também é possível implantar modelos usando o Model Garden. Para mais informações, consulte Conhecer modelos de IA no Model Garden.

Modelos de parceiros

Os seguintes modelos de parceiros são oferecidos como APIs gerenciadas no Model Garden da Vertex AI (MaaS):

Nome do modelo	Modalidade	Descrição	Guia de início rápido
Claude Opus 4.5	Linguagem, visão	A próxima geração do modelo mais inteligente da Anthropic, o Claude Opus 4.5, é líder do setor em programação, agentes, uso de computador e fluxos de trabalho empresariais.	Card de modelo
Claude Sonnet 4.5	Linguagem, visão	O modelo médio da Anthropic para agentes do mundo real, com recursos de programação, uso de computador, segurança cibernética e trabalho com arquivos de escritório, como planilhas.	Card de modelo
Claude Opus 4.1	Linguagem, visão	Líder do setor em programação. Ela oferece performance consistente em tarefas de longa duração que exigem esforço concentrado e milhares de etapas, expandindo significativamente o que os agentes de IA podem resolver. Ideal para impulsionar produtos e recursos de agentes de ponta.	Card de modelo
Claude Haiku 4.5	Linguagem, visão	O Claude Haiku 4.5 oferece desempenho quase de ponta para uma ampla variedade de casos de uso e se destaca como um dos melhores modelos de programação do mundo, com a velocidade e o custo certos para impulsionar produtos sem custo financeiro e experiências de usuário de alto volume.	Card de modelo
Claude Opus 4	Linguagem, visão	O Claude Opus 4 oferece desempenho sustentado em tarefas longas que exigem esforço focado e milhares de etapas, expandindo significativamente o que os agentes de IA podem resolver.	Card de modelo
Claude Sonnet 4	Linguagem, visão	O modelo médio da Anthropic com inteligência superior para usos de alto volume, como programação, pesquisas detalhadas e agentes.	Card de modelo
Claude 3.5 Sonnet v2 da Anthropic	Linguagem, visão	O Claude 3.5 Sonnet atualizado é um modelo de ponta para tarefas de engenharia de software do mundo real e recursos de agente. O Claude 3.5 Sonnet oferece esses avanços pelo mesmo preço e velocidade que o antecessor.	Card de modelo
Haiku do Claude 3 da Anthropic	Idioma	O modelo de texto e visão mais rápido da Anthropic para respostas quase instantâneas a consultas básicas, voltado para experiências de IA perfeitas que imitam interações humanas.	Card de modelo
Claude 3.5 Sonnet da Anthropic	Idioma	O Claude 3.5 Sonnet supera o Claude 3 Opus da Anthropic em uma ampla variedade de avaliações da Anthropic com a velocidade e o custo do modelo de nível médio da Anthropic, o Claude 3 Sonnet.	Card de modelo
Jamba 1.5 Large (pré-lançamento)	Idioma	O Jamba 1.5 Large da AI21 Labs tem respostas de qualidade superior, capacidade de processamento e preços competitivos em comparação com outros modelos da mesma classe de tamanho.	Card de modelo
Jamba 1.5 Mini (pré-lançamento)	Idioma	O Jamba 1.5 Mini da AI21 Labs tem equilíbrio entre qualidade, capacidade de processamento e custo.	Card de modelo
Mistral Medium 3	Idioma	O Mistral Medium 3 é um modelo versátil projetado para uma ampla variedade de tarefas, incluindo programação, raciocínio matemático, compreensão de documentos longos, resumo e diálogo.	Card de modelo
OCR do Mistral (25/05)	Linguagem, visão	O OCR do Mistral (25.05) é uma API de reconhecimento óptico de caracteres para compreensão de documentos. O modelo compreende cada elemento de documentos, como mídia, texto, tabelas e equações.	Card de modelo
Mistral Small 3.1 (25/03)	Idioma	O Mistral Small 3.1 (25/03) é a versão mais recente do modelo Small da Mistral, com recursos multimodais e comprimento de contexto estendido.	Card de modelo
Mistral Large (24.11)	Idioma	O Mistral Large (24.11) é a próxima versão do modelo Mistral Large (24.07), agora com recursos aprimorados de raciocínio e chamada de função.	Card de modelo
Codestral 2	Idioma, código	O Codestral 2 é o modelo especializado em geração de código da Mistral, criado especificamente para preenchimento de lacunas (FIM, na sigla em inglês) de alta precisão, que ajuda os desenvolvedores a escrever e interagir com código usando uma instrução compartilhada e um endpoint de API de conclusão.	Card de modelo
Codestral (25.01)	Código	Um modelo de ponta projetado para geração de código, incluindo preenchimento no meio e preenchimento de código.	Card de modelo

Modelos abertos

Os seguintes modelos abertos são oferecidos como APIs gerenciadas no Model Garden da Vertex AI (MaaS):

Nome do modelo	Modalidade	Descrição	Guia de início rápido
DeepSeek-OCR	Linguagem, visão	Um modelo abrangente de reconhecimento óptico de caracteres (OCR) que analisa e entende documentos complexos. Ele se destaca em tarefas de OCR desafiadoras.	Card de modelo
DeepSeek R1 (0528)	Idioma	A versão mais recente do modelo DeepSeek R1.	Card de modelo
DeepSeek-V3.1	Idioma	Modelo híbrido da DeepSeek que oferece suporte aos modos de raciocínio e sem raciocínio.	Card de modelo
DeepSeek-V3.2	Idioma	Modelo do DeepSeek que harmoniza alta eficiência computacional com raciocínio e desempenho de agente superiores.	Card de modelo
GLM 4.7	Idioma, código	Modelo do GLM projetado para programação principal ou de vibe, uso de ferramentas e raciocínio complexo.	Card de modelo
gpt-oss 120B	Idioma	Um modelo de 120 bilhões de parâmetros que oferece alto desempenho em tarefas de raciocínio.	Card de modelo
gpt-oss 20B	Idioma	Um modelo de 20 bilhões de parâmetros otimizado para eficiência e implantação em hardware de consumo e de borda.	Card de modelo
Kimi K2 Thinking	Idioma	Um modelo de agente de raciocínio de código aberto que raciocina por etapas e usa ferramentas para resolver problemas complexos.	Card de modelo
Llama 3.1	Idioma	Uma coleção de LLMs multilíngues otimizados para casos de uso de diálogo multilíngue, que superam muitos dos modelos de chat fechados e de código aberto em comparativos de mercado comuns. O Llama 3.1 405B está em disponibilidade geral (GA). O Llama 3.1 8B e o Llama 3.1 70B estão em pré-lançamento.	Card de modelo
Llama 3.2 (prévia)	Linguagem, visão	Um modelo multimodal de 90B de tamanho médio que dá suporte ao raciocínio de imagem, como análise de gráficos e legendas de imagens.	Card de modelo
Llama 3.3	Idioma	O Llama 3.3 é um modelo de 70B ajustado por instrução somente de texto que oferece desempenho aprimorado em relação ao Llama 3.1 70B e ao Llama 3.2 90B quando usado para aplicativos somente de texto. Além disso, para alguns aplicativos, o Llama 3.3 70B se aproxima do desempenho do Llama 3.1 405B.	Card de modelo
Llama 4 Maverick 17B-128E	Linguagem, visão	O maior e mais eficiente modelo Llama 4, com recursos de programação, raciocínio e imagem. O Llama 4 Maverick 17B-128E é um modelo multimodal que usa a arquitetura de combinação de especialistas (MoE) e fusão antecipada.	Card de modelo
Llama 4 Scout 17B-16E	Linguagem, visão	O Llama 4 Scout 17B-16E oferece resultados de última geração para a classe de tamanho dele, superando gerações anteriores do Llama e outros modelos abertos e proprietários em vários comparativos. O Llama 4 Scout 17B-16E é um modelo multimodal que usa a arquitetura de combinação de especialistas (MoE) e fusão antecipada.	Card de modelo
MiniMax M2	Idioma, código	Projetado para tarefas relacionadas a agentes e programação, com recursos avançados de planejamento e execução de tarefas complexas de chamada de ferramentas.	Card de modelo
Qwen3 235B	Idioma	Um modelo de peso aberto com capacidade de "pensamento híbrido" para alternar entre raciocínio metódico e conversa rápida.	Card de modelo
Qwen3 Coder	Idioma, código	Um modelo de peso aberto desenvolvido para tarefas avançadas de desenvolvimento de software.	Card de modelo
Qwen3-Next-80B Instruct	Idioma, código	Um modelo da família Qwen3-Next, especializado em seguir comandos específicos.	Card de modelo
Qwen3-Next-80B Thinking	Idioma, código	Um modelo da família Qwen3-Next, especializado em resolução de problemas complexos e raciocínio profundo.	Card de modelo

A seguir

Saiba mais sobre os modelos abertos da Vertex AI para MaaS.
Saiba como chamar APIs de modelos abertos.

Modelos gerenciados da Vertex AI para MaaS Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Modelos de parceiros

Modelos abertos

A seguir

Modelos gerenciados da Vertex AI para MaaS