A Vertex AI oferece suporte a uma lista selecionada de modelos de parceiros e abertos como modelos gerenciados. Esses modelos podem ser usados com a Vertex AI como um modelo como serviço (MaaS) e são oferecidos como uma API gerenciada. Ao usar um modelo gerenciado, você continua enviando solicitações para endpoints da Vertex AI. Os modelos gerenciados não têm servidor, então não é necessário provisionar nem gerenciar infraestrutura.
Os modelos gerenciados podem ser descobertos usando o Model Garden. Também é possível implantar modelos usando o Model Garden. Para mais informações, consulte Conhecer modelos de IA no Model Garden.
Modelos de parceiros
Os seguintes modelos de parceiros são oferecidos como APIs gerenciadas no Model Garden da Vertex AI (MaaS):
Nome do modelo | Modalidade | Descrição | Guia de início rápido |
---|---|---|---|
Claude Sonnet 4.5 | Linguagem, visão | O modelo de tamanho médio da Anthropic para agentes do mundo real, com recursos de programação, uso de computador, segurança cibernética e trabalho com arquivos de escritório, como planilhas. | Card de modelo |
Claude Opus 4.1 | Linguagem, visão | Líder do setor em programação. Ela oferece performance consistente em tarefas de longa duração que exigem esforço concentrado e milhares de etapas, expandindo significativamente o que os agentes de IA podem resolver. Ideal para impulsionar produtos e recursos de agentes de ponta. | Card de modelo |
Claude Haiku 4.5 | Linguagem, visão | O Claude Haiku 4.5 oferece desempenho quase de ponta para uma ampla variedade de casos de uso e se destaca como um dos melhores modelos de programação do mundo, com a velocidade e o custo certos para impulsionar produtos gratuitos e experiências de usuário de alto volume. | Card de modelo |
Claude Opus 4 | Linguagem, visão | O Claude Opus 4 oferece desempenho sustentado em tarefas longas que exigem esforço focado e milhares de etapas, expandindo significativamente o que os agentes de IA podem resolver. | Card de modelo |
Claude Sonnet 4 | Linguagem, visão | O modelo de tamanho médio da Anthropic com inteligência superior para usos de alto volume, como programação, pesquisa detalhada e agentes. | Card de modelo |
Claude 3.7 Sonnet da Anthropic | Linguagem, visão | Modelo líder do setor para programação e agentes de IA, além de ser o primeiro modelo Claude a oferecer raciocínio complexo. | Card de modelo |
Claude 3.5 Sonnet v2 da Anthropic | Linguagem, visão | O Claude 3.5 Sonnet atualizado é um modelo de ponta para tarefas de engenharia de software do mundo real e recursos de agente. O Claude 3.5 Sonnet oferece esses avanços pelo mesmo preço e velocidade que o antecessor. | Card de modelo |
Claude 3.5 Haiku da Anthropic | Linguagem, visão | O Claude 3.5 Haiku, a próxima geração do modelo mais rápido e econômico da Anthropic, é ideal para casos de uso em que a velocidade e a acessibilidade são importantes. | Card de modelo |
Haiku do Claude 3 da Anthropic | Idioma | O modelo de texto e visão mais rápido da Anthropic para respostas quase instantâneas a consultas básicas, voltado para experiências de IA perfeitas que imitam interações humanas. | Card de modelo |
Claude 3.5 Sonnet da Anthropic | Idioma | O Claude 3.5 Sonnet supera o Claude 3 Opus da Anthropic em uma ampla variedade de avaliações da Anthropic com a velocidade e o custo do modelo de nível médio da Anthropic, o Claude 3 Sonnet. | Card de modelo |
Jamba 1.5 Large (pré-lançamento) | Idioma | O Jamba 1.5 Large da AI21 Labs tem respostas de qualidade superior, capacidade de processamento e preços competitivos em comparação com outros modelos da mesma classe de tamanho. | Card de modelo |
Jamba 1.5 Mini (pré-lançamento) | Idioma | O Jamba 1.5 Mini da AI21 Labs tem equilíbrio entre qualidade, capacidade de processamento e custo. | Card de modelo |
Mistral Medium 3 | Idioma | O Mistral Medium 3 é um modelo versátil projetado para uma ampla variedade de tarefas, incluindo programação, raciocínio matemático, compreensão de documentos longos, resumo e diálogo. | Card de modelo |
OCR do Mistral (25/05) | Linguagem, visão | O OCR do Mistral (25.05) é uma API de reconhecimento óptico de caracteres para compreensão de documentos. O modelo compreende cada elemento de documentos, como mídia, texto, tabelas e equações. | Card de modelo |
Mistral Small 3.1 (25/03) | Idioma | O Mistral Small 3.1 (25/03) é a versão mais recente do modelo Small da Mistral, com recursos multimodais e comprimento de contexto estendido. | Card de modelo |
Mistral Large (24.11) | Idioma | O Mistral Large (24.11) é a próxima versão do modelo Mistral Large (24.07), agora com recursos aprimorados de raciocínio e chamada de função. | Card de modelo |
Codestral 2 | Idioma, código | O Codestral 2 é o modelo especializado em geração de código da Mistral, criado especificamente para preenchimento de lacunas (FIM) de alta precisão, que ajuda os desenvolvedores a escrever e interagir com código usando uma instrução compartilhada e um endpoint de API de conclusão. | Card de modelo |
Codestral (25.01) | Código | Um modelo de ponta projetado para geração de código, incluindo preenchimento no meio e preenchimento de código. | Card de modelo |
Modelos abertos
Os seguintes modelos abertos são oferecidos como APIs gerenciadas no Model Garden da Vertex AI (MaaS):
Nome do modelo | Modalidade | Descrição | Guia de início rápido |
---|---|---|---|
gpt-oss 120B | Idioma | Um modelo de 120 bilhões de parâmetros que oferece alto desempenho em tarefas de raciocínio. | Card de modelo |
gpt-oss 20B | Idioma | Um modelo de 20 bilhões de parâmetros otimizado para eficiência e implantação em hardware de consumo e de borda. | Card de modelo |
Qwen3-Next-80B Thinking | Idioma, código | Um modelo da família Qwen3-Next, especializado em resolução de problemas complexos e raciocínio profundo. | Card de modelo |
Qwen3-Next-80B Instruct | Idioma, código | Um modelo da família Qwen3-Next, especializado em seguir comandos específicos. | Card de modelo |
Qwen3 Coder | Idioma, código | Um modelo de peso aberto desenvolvido para tarefas avançadas de desenvolvimento de software. | Card de modelo |
Qwen3 235B | Idioma | Um modelo de peso aberto com capacidade de "pensamento híbrido" para alternar entre raciocínio metódico e conversa rápida. | Card de modelo |
DeepSeek-V3.1 | Idioma | Modelo híbrido da DeepSeek que oferece suporte aos modos de raciocínio e sem raciocínio. | Card de modelo |
DeepSeek R1 (0528) | Idioma | A versão mais recente do modelo DeepSeek R1. | Card de modelo |
Llama 4 Maverick 17B-128E | Linguagem, visão | O maior e mais eficiente modelo Llama 4 com recursos de programação, raciocínio e imagem. O Llama 4 Maverick 17B-128E é um modelo multimodal que usa a arquitetura de combinação de especialistas (MoE) e fusão antecipada. | Card de modelo |
Llama 4 Scout 17B-16E | Linguagem, visão | O Llama 4 Scout 17B-16E oferece resultados de ponta para a classe de tamanho dele, superando gerações anteriores do Llama e outros modelos abertos e proprietários em vários comparativos. O Llama 4 Scout 17B-16E é um modelo multimodal que usa a arquitetura de combinação de especialistas (MoE) e fusão antecipada. | Card de modelo |
Llama 3.3 | Idioma | O Llama 3.3 é um modelo de 70 bilhões de parâmetros ajustado por instruções somente de texto que oferece desempenho aprimorado em relação ao Llama 3.1 70B e ao Llama 3.2 90B quando usado em aplicativos somente de texto. Além disso, para alguns aplicativos, o Llama 3.3 70B se aproxima do desempenho do Llama 3.1 405B. | Card de modelo |
Llama 3.2 (pré-lançamento) | Linguagem, visão | Um modelo multimodal de 90B de tamanho médio que dá suporte ao raciocínio de imagem, como análise de gráficos e legendas de imagens. | Card de modelo |
Llama 3.1 | Idioma |
Uma coleção de LLMs multilíngues otimizados para casos de uso de diálogo multilíngue, que superam muitos dos modelos de chat fechados e de código aberto em comparativos de mercado comuns. O Llama 3.1 405B está em disponibilidade geral (GA). O Llama 3.1 8B e o Llama 3.1 70B estão em pré-lançamento. |
Card de modelo |
A seguir
- Saiba mais sobre os modelos abertos da Vertex AI para MaaS.
- Saiba como chamar APIs de modelos abertos.