Kimi K2 Thinking è un modello open source che funziona come un "agente di ragionamento", ragionando passo dopo passo mentre utilizza strumenti per ottenere prestazioni all'avanguardia in vari benchmark. È in grado di eseguire fino a 200-300 chiamate di strumenti sequenziali senza intervento umano, consentendogli di risolvere problemi complessi in un'ampia gamma di attività. Il modello utilizza l'addestramento quantizzazione consapevole (QAT) per supportare l'inferenza INT4, che offre un miglioramento di circa il doppio della velocità di generazione.
Specifiche dell'API gestita (MaaS)
Visualizzare la scheda del modello in Model Garden
| ID modello | kimi-k2-thinking-maas |
|
|---|---|---|
| Fase di lancio | GA | |
| Ingressi e uscite supportati |
|
|
| Funzionalità |
|
|
| Tipi di utilizzo |
|
|
| Versioni |
|
|
| Aree geografiche supportate | ||
|
Disponibilità del modello |
|
|
|
Elaborazione ML |
|
|
| Limiti |
globale:
|
|
| Prezzi | Vedi Prezzi. | |
Esegui il deployment come modello con deployment autonomo
Per eseguire autonomamente il deployment del modello, vai alla scheda del modello Kimi K2 Thinking nella console Model Garden e fai clic su Esegui il deployment del modello. Per saperne di più sul deployment e sull'utilizzo dei modelli partner, consulta Esegui il deployment di un modello partner ed effettua richieste di previsione.