Modelos Qwen

Os modelos Qwen na Vertex AI oferecem modelos totalmente gerenciados e sem servidor modelos como APIs. Para usar um modelo Qwen na Vertex AI, envie uma solicitação diretamente para o endpoint de API Vertex AI. Como os modelos Qwen usam uma API gerenciada, não é necessário provisionar nem gerenciar a infraestrutura.

É possível transmitir as respostas para reduzir a percepção de latência do usuário final. Uma resposta transmitida usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.

Modelos Qwen disponíveis

Os modelos a seguir estão disponíveis na Qwen para uso na Vertex AI. Para acessar um modelo Qwen, acesse o card de modelo do Model Garden.

Qwen3-Next-80B Instruct

O Qwen3-Next-80B Instruct é um modelo de linguagem da família Qwen3-Next. Ele foi projetado para seguir comandos específicos e processar textos muito longos. Ele usa um design inteligente chamado Mixture-of-Experts (MoE), que ativa um subconjunto de parâmetros disponíveis para processar informações, o que o torna mais rápido e econômico do que outros modelos do mesmo tamanho.

A versão Instruct é ajustada para respostas diretas e confiáveis em aplicativos de chat e de agente. A grande janela de contexto permite manter uma conversa inteira ou um documento grande na memória.

Acessar o card do modelo Qwen3-Next-80B Instruct

Qwen3-Next-80B Thinking

O Qwen3-Next-80B Thinking é um modelo de linguagem da família Qwen3-Next de modelos. Ela é especializada em resolução de problemas complexos e raciocínio profundo. O modo de "pensamento" gera um processo de raciocínio visível e detalhado junto com a resposta final, o que o torna ideal para tarefas que exigem lógica transparente, como provas matemáticas, depuração de código complexo ou planejamento de agentes de várias etapas.

Acessar o card do modelo Qwen3-Next-80B Thinking

Qwen3 Coder (Qwen3 Coder)

O Qwen3 Coder (Qwen3 Coder) é um modelo de grande escala e peso aberto desenvolvido para tarefas avançadas de desenvolvimento de software. O principal recurso do modelo é a grande janela de contexto, que permite processar e entender grandes bases de código de forma abrangente.

Acessar o card do modelo Qwen3 Coder

Qwen3 235B (Qwen3 235B)

O Qwen3 235B (Qwen3 235B) é um modelo grande de 235 bilhões de parâmetros. O modelo se destaca pela capacidade de "pensamento híbrido", que permite aos usuários alternar dinamicamente entre um modo de "pensamento" metódico, etapa por etapa, para tarefas complexas, como raciocínio matemático e programação, e um modo rápido de "não pensamento" para conversas de uso geral. A grande janela de contexto o torna adequado para casos de uso que exigem raciocínio profundo e compreensão de textos longos.

Acessar o card do modelo Qwen3 235B

Usar modelos Qwen

Para saber como fazer chamadas de streaming e não streaming para modelos Qwen, consulte Chamar APIs de modelos abertos.

A seguir