Modèles Qwen

Les modèles Qwen sur Vertex AI offrent des modèles sans serveur et entièrement gérés en tant qu'API. Pour utiliser un modèle Qwen sur Vertex AI, envoyez une requête directement au point de terminaison de l'API Vertex AI. Étant donné que les modèles Qwen utilisent une API gérée, il n'est pas nécessaire de provisionner ni de gérer l'infrastructure.

Vous pouvez diffuser vos réponses en flux continu pour réduire la perception de la latence côté utilisateur. Une réponse en flux continu utilise des événements envoyés par le serveur (SSE) pour diffuser la réponse de manière incrémentielle.

Modèles Qwen disponibles

Les modèles Qwen suivants sont disponibles et peuvent être utilisés dans Vertex AI. Pour accéder à un modèle Qwen, accédez à sa fiche de modèle Model Garden.

Qwen3-Next-80B Instruct

Qwen3-Next-80B Instruct est un modèle de langage de la famille de modèles Qwen3-Next. Il est conçu pour suivre des commandes spécifiques et traiter de très longs textes. Il utilise une conception intelligente appelée Mixture-of-Experts (MoE), qui active un sous-ensemble de paramètres disponibles pour traiter les informations. Cela le rend plus rapide et plus économique à exécuter que d'autres modèles de sa taille.

La version "Instruct" est optimisée pour fournir des réponses fiables et directes dans les applications de chat et d'agent. Sa grande fenêtre de contexte lui permet de conserver en mémoire une conversation entière ou un document volumineux.

Accéder à la fiche de modèle Qwen3-Next-80B Instruct

Qwen3-Next-80B Thinking

Qwen3-Next-80B Thinking est un modèle de langage de la famille de modèles Qwen3-Next. Il est spécialisé dans la résolution de problèmes complexes et le raisonnement approfondi. Son mode "réflexion" génère un processus de raisonnement visible, étape par étape, en plus de la réponse finale. Il est donc idéal pour les tâches nécessitant une logique transparente, comme les démonstrations mathématiques, le débogage de code complexe ou la planification d'agents en plusieurs étapes.

Accéder à la fiche de modèle Qwen3-Next-80B Thinking

Qwen3 Coder (Qwen3 Coder)

Qwen3 Coder (Qwen3 Coder) est un modèle open source à grande échelle développé pour les tâches avancées de développement de logiciels. La principale caractéristique du modèle est sa grande fenêtre de contexte, qui lui permet de traiter et de comprendre de grandes bases de code de manière exhaustive.

Accéder à la fiche de modèle Qwen3 Coder

Qwen3 235B (Qwen3 235B)

Qwen3 235B (Qwen3 235B) est un grand modèle de 235 milliards de paramètres. Le modèle se distingue par sa capacité de "pensée hybride", qui permet aux utilisateurs de basculer dynamiquement entre un mode de "pensée" méthodique et étape par étape pour les tâches complexes comme le raisonnement mathématique et le codage, et un mode de "non-pensée" rapide pour les conversations à usage général. Sa grande fenêtre de contexte le rend adapté aux cas d'utilisation nécessitant un raisonnement approfondi et une compréhension des contenus longs.

Accéder à la fiche de modèle Qwen3 235B

Utiliser les modèles Qwen

Pour savoir comment effectuer des appels en streaming et non en streaming aux modèles Qwen, consultez Appeler des API de modèles ouverts.

Étapes suivantes