Kimi K2 Thinking

Kimi K2 Thinking est un modèle Open Source qui fonctionne comme un "agent de réflexion". Il raisonne étape par étape tout en utilisant des outils pour atteindre des performances de pointe sur différents benchmarks. Il est capable d'exécuter jusqu'à 200 à 300 appels d'outils séquentiels sans intervention humaine, ce qui lui permet de résoudre des problèmes complexes pour un large éventail de tâches. Le modèle utilise l'entraînement tenant compte de la quantification (QAT, Quantization-Aware Training) pour prendre en charge l'inférence INT4, ce qui permet d'améliorer la vitesse de génération d'environ deux fois.

Afficher la fiche du modèle dans Model Garden

ID du modèle kimi-k2-thinking-maas
Étape de lancement DG
Entrées et sorties acceptées
  • Entrées :
    texte, documents
  • Sorties :
    texte
Capacités
Types d'utilisation
Versions
  • Kimi K2 Thinking
    • Étape de lancement : disponibilité générale
    • Date de publication : 13 novembre 2025
Régions où le service est disponible

Disponibilité du modèle

  • Région
    • global

Traitement ML

  • Région
    • Multi-region
Limites

global :

  • Sortie max : 262 144
  • Longueur du contexte : 262 144

Tarifs Voir les tarifs