Kimi, K2, Thinking

Kimi K2 Thinking es un modelo de código abierto que funciona como un "agente de pensamiento", ya que razona paso a paso mientras usa herramientas para lograr un rendimiento de vanguardia en varias comparativas. Es capaz de ejecutar hasta 200 o 300 llamadas a herramientas secuenciales sin intervención humana, lo que le permite resolver problemas complejos en una amplia variedad de tareas. El modelo usa el entrenamiento con reconocimiento de la cuantificación (QAT) para admitir la inferencia INT4, lo que proporciona una mejora de aproximadamente el doble en la velocidad de generación.

Especificaciones de la API administrada (MaaS)

Ver la tarjeta del modelo en Model Garden

Regiones admitidas
ID de modelo	`kimi-k2-thinking-maas`
Etapa de lanzamiento	DG
Entradas y salidas compatibles	Entradas: Texto, Documentos Resultados: Texto
Funciones	Admitido Llamada a función Resultados estructurados Pensamiento No compatible Predicciones por lotes
Opciones de consumo	Admitido Cuota compartida dinámica Capacidad de procesamiento aprovisionada No compatible Cuota fija
Versiones	`Kimi K2 Thinking` Etapa de lanzamiento: DG Fecha de lanzamiento: 13 de noviembre de 2025
	Disponibilidad del modelo	Global `global`
	Procesamiento de AA	Región `Multi-region`
Límites	global: Salida máx.: 262,144 Longitud del contexto: 262,144

Implementar como modelo autoinstalado

Para implementar el modelo por tu cuenta, navega a la tarjeta del modelo de Kimi K2 Thinking en la consola de Model Garden y haz clic en Implementar modelo. Para obtener más información sobre la implementación y el uso de modelos de socios, consulta Implementa un modelo de socio y realiza solicitudes de predicción.

Kimi, K2, Thinking Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Especificaciones de la API administrada (MaaS)

Implementar como modelo autoinstalado

Kimi, K2, Thinking