Kimi, K2, Thinking

Kimi K2 Thinking es un modelo de código abierto que funciona como un "agente de pensamiento", que razona paso a paso mientras usa herramientas para lograr un rendimiento de vanguardia en varias comparativas. Es capaz de ejecutar hasta 200 o 300 llamadas a herramientas secuenciales sin intervención humana, lo que le permite resolver problemas complejos en una amplia variedad de tareas. El modelo usa el entrenamiento con reconocimiento de la cuantificación (QAT) para admitir la inferencia INT4, lo que proporciona una mejora de aproximadamente el doble en la velocidad de generación.

Especificaciones de la API administrada (MaaS)

Ver la tarjeta del modelo en Model Garden

ID de modelo kimi-k2-thinking-maas
Etapa de lanzamiento DG
Entradas y salidas compatibles
  • Entradas:
    Texto, Documentos
  • Resultados:
    Texto
Funciones
Tipos de uso
Versiones
  • Kimi K2 Thinking
    • Etapa de lanzamiento: DG
    • Fecha de lanzamiento: 13 de noviembre de 2025
Regiones admitidas

Disponibilidad del modelo

  • Región
    • global

Procesamiento de AA

  • Región
    • Multi-region
Límites

global:

  • Salida máx.: 262,144
  • Longitud del contexto: 262,144

Precios Consulta la sección de precios.

Implementar como modelo autoinstalado

Para implementar el modelo por tu cuenta, navega a la tarjeta del modelo Kimi K2 Thinking en la consola de Model Garden y haz clic en Implementar modelo. Para obtener más información sobre la implementación y el uso de modelos de socios, consulta Implementa un modelo de socio y realiza solicitudes de predicción.