Kimi K2 Thinking es un modelo de código abierto que funciona como un "agente de pensamiento", que razona paso a paso mientras usa herramientas para lograr un rendimiento de vanguardia en varias comparativas. Es capaz de ejecutar hasta 200 o 300 llamadas a herramientas secuenciales sin intervención humana, lo que le permite resolver problemas complejos en una amplia variedad de tareas. El modelo usa el entrenamiento con reconocimiento de la cuantificación (QAT) para admitir la inferencia INT4, lo que proporciona una mejora de aproximadamente el doble en la velocidad de generación.
Especificaciones de la API administrada (MaaS)
Ver la tarjeta del modelo en Model Garden
| ID de modelo | kimi-k2-thinking-maas |
|
|---|---|---|
| Etapa de lanzamiento | DG | |
| Entradas y salidas compatibles |
|
|
| Funciones |
|
|
| Tipos de uso |
|
|
| Versiones |
|
|
| Regiones admitidas | ||
|
Disponibilidad del modelo |
|
|
|
Procesamiento de AA |
|
|
| Límites |
global:
|
|
| Precios | Consulta la sección de precios. | |
Implementar como modelo autoinstalado
Para implementar el modelo por tu cuenta, navega a la tarjeta del modelo Kimi K2 Thinking en la consola de Model Garden y haz clic en Implementar modelo. Para obtener más información sobre la implementación y el uso de modelos de socios, consulta Implementa un modelo de socio y realiza solicitudes de predicción.