Kimi K2 Thinking es un modelo de código abierto que funciona como un "agente de pensamiento", razonando paso a paso mientras usa herramientas para lograr un rendimiento de vanguardia en varias comparativas. Es capaz de ejecutar hasta 200-300 llamadas a herramientas secuenciales sin intervención humana, lo que le permite resolver problemas complejos en una amplia gama de tareas. El modelo usa el entrenamiento con cuantización (QAT) para admitir la inferencia INT4, lo que supone una mejora de aproximadamente el doble en la velocidad de generación.
Especificaciones de la API gestionada (MaaS)
Ver la tarjeta de modelo en Model Garden
| ID del modelo | kimi-k2-thinking-maas |
|
|---|---|---|
| Fase de lanzamiento | GA | |
| Entradas y salidas admitidas |
|
|
| Funciones |
|
|
| Tipos de uso |
|
|
| Versiones |
|
|
| Regiones disponibles | ||
|
Disponibilidad del modelo |
|
|
|
Procesamiento de aprendizaje automático |
|
|
| Límites |
global:
|
|
| Precios | Consulta Precios. | |
Desplegar como un modelo autodesplegado
Para desplegar el modelo por tu cuenta, ve a la tarjeta del modelo Kimi K2 Thinking en la consola Model Garden y haz clic en Desplegar modelo. Para obtener más información sobre cómo implementar y usar modelos de partners, consulte el artículo Implementar un modelo de partner y enviar solicitudes de predicción.