Kimi K2 Thinking adalah model open source yang beroperasi sebagai "agen penalaran", yang melakukan penalaran langkah demi langkah sambil menggunakan alat untuk mencapai performa canggih pada berbagai tolok ukur. Model ini mampu mengeksekusi hingga 200-300 panggilan alat berurutan tanpa intervensi manusia, sehingga memungkinkan model ini memecahkan masalah kompleks di berbagai tugas. Model ini menggunakan Pelatihan yang Sadar Kuantisasi (QAT) untuk mendukung inferensi INT4, yang memberikan peningkatan kecepatan pembuatan sekitar 2x.
Spesifikasi Managed API (MaaS)
Melihat kartu model di Model Garden
| ID Model | kimi-k2-thinking-maas |
|
|---|---|---|
| Tahap peluncuran | GA | |
| Input & output yang didukung |
|
|
| Kemampuan |
|
|
| Opsi konsumsi |
|
|
| Versi |
|
|
| Region yang didukung | ||
|
Ketersediaan model |
|
|
|
Pemrosesan ML |
|
|
| Batas |
global:
|
|
Men-deploy sebagai model yang di-deploy sendiri
Untuk men-deploy model secara mandiri, buka kartu model Kimi K2 Thinking di konsol Model Garden, lalu klik Deploy model. Untuk mengetahui informasi selengkapnya tentang cara men-deploy dan menggunakan model partner, lihat Men-deploy model partner dan membuat permintaan prediksi.