Kimi K2 Thinking

Kimi K2 Thinking es un modelo de código abierto que funciona como un "agente de pensamiento", razonando paso a paso mientras usa herramientas para lograr un rendimiento de vanguardia en varias comparativas. Es capaz de ejecutar hasta 200-300 llamadas a herramientas secuenciales sin intervención humana, lo que le permite resolver problemas complejos en una amplia gama de tareas. El modelo usa el entrenamiento con cuantización (QAT) para admitir la inferencia INT4, lo que supone una mejora de aproximadamente el doble en la velocidad de generación.

Especificaciones de la API gestionada (MaaS)

Ver la tarjeta de modelo en Model Garden

ID del modelo kimi-k2-thinking-maas
Fase de lanzamiento GA
Entradas y salidas admitidas
  • Entradas:
    Texto, Documentos
  • Salidas:
    Texto
Funciones
Tipos de uso
Versiones
  • Kimi K2 Thinking
    • Fase de lanzamiento: GA
    • Fecha de lanzamiento: 13 de noviembre del 2025
Regiones disponibles

Disponibilidad del modelo

  • Región
    • global

Procesamiento de aprendizaje automático

  • Región
    • Multi-region
Límites

global:

  • Salida máxima: 262144
  • Longitud del contexto: 262144

Precios Consulta Precios.

Desplegar como un modelo autodesplegado

Para desplegar el modelo por tu cuenta, ve a la tarjeta del modelo Kimi K2 Thinking en la consola Model Garden y haz clic en Desplegar modelo. Para obtener más información sobre cómo implementar y usar modelos de partners, consulte el artículo Implementar un modelo de partner y enviar solicitudes de predicción.