Kimi K2 Thinking

Kimi K2 Thinking es un modelo de código abierto que funciona como un "agente de pensamiento", razonando paso a paso mientras usa herramientas para lograr un rendimiento de vanguardia en varias comparativas. Es capaz de ejecutar hasta 200-300 llamadas a herramientas secuenciales sin intervención humana, lo que le permite resolver problemas complejos en una amplia gama de tareas. El modelo usa el entrenamiento con cuantización (QAT) para admitir la inferencia INT4, lo que supone una mejora de aproximadamente el doble en la velocidad de generación.

Especificaciones de la API gestionada (MaaS)

Ver la tarjeta de modelo en Model Garden

Regiones disponibles
ID del modelo	`kimi-k2-thinking-maas`
Fase de lanzamiento	GA
Entradas y salidas admitidas	Entradas: Texto, Documentos Salidas: Texto
Funciones	Compatible Llamadas a funciones Salida estructurada Pensando No compatible Predicciones por lotes
Tipos de uso	Compatible Cuota compartida dinámica Capacidad de procesamiento aprovisionada No compatible Cuota fija
Versiones	`Kimi K2 Thinking` Fase de lanzamiento: GA Fecha de lanzamiento: 13 de noviembre del 2025
	Disponibilidad del modelo	Región `global`
	Procesamiento de aprendizaje automático	Región `Multi-region`
Límites	global: Salida máxima: 262144 Longitud del contexto: 262144
Precios	Consulta Precios.

Desplegar como un modelo autodesplegado

Para desplegar el modelo por tu cuenta, ve a la tarjeta del modelo Kimi K2 Thinking en la consola Model Garden y haz clic en Desplegar modelo. Para obtener más información sobre cómo implementar y usar modelos de partners, consulte el artículo Implementar un modelo de partner y enviar solicitudes de predicción.

Kimi K2 Thinking Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Especificaciones de la API gestionada (MaaS)

Desplegar como un modelo autodesplegado

Kimi K2 Thinking