Diese Seite wurde von der Cloud Translation API übersetzt.

Kimi K2 Thinking

Kimi K2 Thinking ist ein Open-Source-Modell, das als „Thinking-Agent“ fungiert und schrittweise Schlussfolgerungen zieht, während es Tools verwendet, um bei verschiedenen Benchmarks eine erstklassige Leistung zu erzielen. Das Modell kann bis zu 200–300 sequenzielle Tool-Aufrufe ohne menschliches Eingreifen ausführen und so komplexe Probleme bei einer Vielzahl von Aufgaben lösen. Das Modell verwendet Quantization-Aware Training (QAT) zur Unterstützung von INT4-Inferenz, was zu einer etwa doppelt so hohen Generierungsgeschwindigkeit führt.

Spezifikationen für verwaltete APIs (MaaS)

Modellkarte in Model Garden ansehen

Unterstützte Regionen
Modell-ID	`kimi-k2-thinking-maas`
Startphase	GA
Unterstützte Ein- und Ausgaben	Eingaben: Text, Dokumente Ausgaben: Text
Leistungsspektrum	Unterstützt Funktionsaufrufe Strukturierte Ausgabe Denken Nicht unterstützt Batchvorhersagen
Nutzungstypen	Unterstützt Dynamisches freigegebenes Kontingent Bereitgestellter Durchsatz Nicht unterstützt Festes Kontingent
Versionen	`Kimi K2 Thinking` Einführungsphase:GA Veröffentlichungsdatum:13. November 2025
	Modellverfügbarkeit	Region `global`
	ML-Verarbeitung	Region `Multi-region`
Limits	global: Maximale Ausgabe: 262.144 Kontextlänge: 262.144
Preise	Weitere Informationen finden Sie unter Preise.

Als selbst bereitgestelltes Modell bereitstellen

Wenn Sie das Modell selbst bereitstellen möchten, rufen Sie in der Model Garden-Konsole die Modellkarte für Kimi K2 Thinking auf und klicken Sie auf Modell bereitstellen. Weitere Informationen zum Bereitstellen und Verwenden von Partnermodellen finden Sie unter Partnermodell bereitstellen und Vorhersageanfragen stellen.

Kimi K2 Thinking Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Spezifikationen für verwaltete APIs (MaaS)

Als selbst bereitgestelltes Modell bereitstellen

Kimi K2 Thinking