Os modelos Qwen na Vertex AI oferecem modelos totalmente gerenciados e sem servidor modelos como APIs. Para usar um modelo Qwen na Vertex AI, envie uma solicitação diretamente para o endpoint de API Vertex AI. Como os modelos Qwen usam uma API gerenciada, não é necessário provisionar nem gerenciar a infraestrutura.
É possível transmitir as respostas para reduzir a percepção de latência do usuário final. Uma resposta transmitida usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.
Modelos Qwen disponíveis
Os modelos a seguir estão disponíveis na Qwen para uso na Vertex AI. Para acessar um modelo Qwen, acesse o card de modelo do Model Garden.
Qwen3-Next-80B Instruct
O Qwen3-Next-80B Instruct é um modelo de linguagem da família Qwen3-Next. Ele foi projetado para seguir comandos específicos e processar textos muito longos. Ele usa um design inteligente chamado Mixture-of-Experts (MoE), que ativa um subconjunto de parâmetros disponíveis para processar informações, o que o torna mais rápido e econômico do que outros modelos do mesmo tamanho.
A versão Instruct é ajustada para respostas diretas e confiáveis em aplicativos de chat e de agente. A grande janela de contexto permite manter uma conversa inteira ou um documento grande na memória.
Acessar o card do modelo Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking
O Qwen3-Next-80B Thinking é um modelo de linguagem da família Qwen3-Next de modelos. Ela é especializada em resolução de problemas complexos e raciocínio profundo. O modo de "pensamento" gera um processo de raciocínio visível e detalhado junto com a resposta final, o que o torna ideal para tarefas que exigem lógica transparente, como provas matemáticas, depuração de código complexo ou planejamento de agentes de várias etapas.
Acessar o card do modelo Qwen3-Next-80B Thinking
Qwen3 Coder (Qwen3 Coder)
O Qwen3 Coder (Qwen3 Coder) é um modelo de grande escala e peso aberto
desenvolvido para tarefas avançadas de desenvolvimento de software. O principal recurso do modelo é a grande janela de contexto, que permite processar e entender grandes bases de código de forma abrangente.
Acessar o card do modelo Qwen3 Coder
Qwen3 235B (Qwen3 235B)
O Qwen3 235B (Qwen3 235B) é um modelo grande de 235 bilhões de parâmetros. O modelo se destaca pela capacidade de "pensamento híbrido", que permite aos usuários alternar dinamicamente entre um modo de "pensamento" metódico, etapa por etapa, para tarefas complexas, como raciocínio matemático e programação, e um modo rápido de "não pensamento" para conversas de uso geral. A grande janela de contexto o torna adequado para casos de uso que exigem raciocínio profundo e compreensão de textos longos.
Acessar o card do modelo Qwen3 235B
Usar modelos Qwen
Para saber como fazer chamadas de streaming e não streaming para modelos Qwen, consulte Chamar APIs de modelos abertos.
A seguir
- Saiba como chamar APIs de modelos abertos.