Kimi K2 Thinking ist ein Open-Source-Modell, das als „Thinking-Agent“ fungiert und schrittweise Schlussfolgerungen zieht, während es Tools verwendet, um bei verschiedenen Benchmarks eine erstklassige Leistung zu erzielen. Das Modell kann bis zu 200–300 sequenzielle Tool-Aufrufe ohne menschliches Eingreifen ausführen und so komplexe Probleme bei einer Vielzahl von Aufgaben lösen. Das Modell verwendet Quantization-Aware Training (QAT) zur Unterstützung von INT4-Inferenz, was zu einer etwa doppelt so hohen Generierungsgeschwindigkeit führt.
Spezifikationen für verwaltete APIs (MaaS)
Modellkarte in Model Garden ansehen
| Modell-ID | kimi-k2-thinking-maas |
|
|---|---|---|
| Startphase | GA | |
| Unterstützte Ein- und Ausgaben |
|
|
| Leistungsspektrum |
|
|
| Nutzungstypen |
|
|
| Versionen |
|
|
| Unterstützte Regionen | ||
|
Modellverfügbarkeit |
|
|
|
ML-Verarbeitung |
|
|
| Limits |
global:
|
|
| Preise | Weitere Informationen finden Sie unter Preise. | |
Als selbst bereitgestelltes Modell bereitstellen
Wenn Sie das Modell selbst bereitstellen möchten, rufen Sie in der Model Garden-Konsole die Modellkarte für Kimi K2 Thinking auf und klicken Sie auf Modell bereitstellen. Weitere Informationen zum Bereitstellen und Verwenden von Partnermodellen finden Sie unter Partnermodell bereitstellen und Vorhersageanfragen stellen.