Modelos de Qwen

Los modelos Qwen en Vertex AI ofrecen modelos completamente administrados y sin servidores como APIs. Para usar un modelo de Qwen en Vertex AI, envía una solicitud directamente al extremo de API de Vertex AI. Debido a que los modelos de Qwen usan una API administrada, no es necesario aprovisionar ni administrar la infraestructura.

Puedes transmitir tus respuestas para reducir la percepción de latencia del usuario final. Una respuesta transmitida usa eventos enviados por el servidor (SSE) para transmitir la respuesta de forma incremental.

Modelos de Qwen disponibles

Los siguientes modelos están disponibles de Qwen para usarlos en Vertex AI. Para acceder a un modelo de Qwen, ve a su tarjeta de modelo de Model Garden.

Qwen3-Next-80B Instruct

Qwen3-Next-80B Instruct es un modelo de lenguaje de la familia de modelos Qwen3-Next. Está diseñado para seguir comandos específicos y controlar fragmentos de texto muy largos. Utiliza un diseño inteligente llamado Mixture-of-Experts (MoE), que activa un subconjunto de parámetros disponibles para procesar información, lo que hace que su ejecución sea más rápida y rentable que la de otros modelos de su tamaño.

La versión Instruct se ajustó para brindar respuestas confiables y directas en chats y aplicaciones de agentes, y su gran ventana de contexto le permite mantener en la memoria una conversación completa o un documento extenso.

Ir a la tarjeta de modelo de Qwen3-Next-80B Instruct

Qwen3-Next-80B Thinking

Qwen3-Next-80B Thinking es un modelo de lenguaje de la familia de modelos Qwen3-Next. Está especializado en la resolución de problemas complejos y el razonamiento profundo. Su modo de "pensamiento" genera un proceso de razonamiento visible paso a paso junto con la respuesta final, lo que lo hace ideal para tareas que requieren lógica transparente, como pruebas matemáticas, depuración de código intrincado o planificación de agentes de varios pasos.

Ir a la tarjeta de modelo de Qwen3-Next-80B Thinking

Qwen3 Coder (Qwen3 Coder)

Qwen3 Coder (Qwen3 Coder) es un modelo de gran escala y de código abierto desarrollado para tareas avanzadas de desarrollo de software. La característica clave del modelo es su gran ventana de contexto, que le permite procesar y comprender grandes bases de código de manera integral.

Ir a la tarjeta de modelo de Qwen3 Coder

Qwen3 235B (Qwen3 235B)

Qwen3 235B (Qwen3 235B) es un modelo grande con 235 mil millones de parámetros. El modelo se distingue por su capacidad de "pensamiento híbrido", que permite a los usuarios cambiar de forma dinámica entre un modo de "pensamiento" metódico y paso a paso para tareas complejas, como el razonamiento matemático y la programación, y un modo rápido de "no pensamiento" para conversaciones de uso general. Su gran ventana de contexto lo hace adecuado para casos de uso que requieren un razonamiento profundo y comprensión de formato largo.

Ir a la tarjeta de modelo de Qwen3 235B

Usa modelos de Qwen

Para obtener información sobre cómo realizar llamadas de transmisión y no transmisión a los modelos de Qwen, consulta Cómo llamar a las APIs de modelos abiertos.

¿Qué sigue?