Kimi K2 Thinking

Kimi K2 Thinking è un modello open source che funziona come un "agente di ragionamento", ragionando passo dopo passo mentre utilizza strumenti per ottenere prestazioni all'avanguardia in vari benchmark. È in grado di eseguire fino a 200-300 chiamate di strumenti sequenziali senza intervento umano, consentendo di risolvere problemi complessi in un'ampia gamma di attività. Il modello utilizza l'addestramento quantizzazione consapevole (QAT) per supportare l'inferenza INT4, che offre un miglioramento di circa il doppio della velocità di generazione.

Specifiche dell'API gestita (MaaS)

Visualizzare la scheda del modello in Model Garden

Aree geografiche supportate
ID modello	`kimi-k2-thinking-maas`
Fase di lancio	GA
Input e output supportati	Input: Testo, Documenti Output: Testo
Funzionalità	Supportato Chiamata di funzione Output strutturato Pensieroso Non supportata Previsioni batch
Opzioni di consumo	Supportato Quota condivisa dinamica Throughput riservato Non supportata Quota fissa
Versioni	`Kimi K2 Thinking` Fase di lancio: GA Data di uscita: 13 novembre 2025
	Disponibilità del modello	Globale `global`
	Elaborazione ML	Regione `Multi-region`
Limiti	globale: Output massimo: 262.144 Lunghezza del contesto: 262.144

Esegui il deployment come modello con deployment autonomo

Per eseguire autonomamente il deployment del modello, vai alla scheda del modello Kimi K2 Thinking nella console Model Garden e fai clic su Esegui il deployment del modello. Per saperne di più sul deployment e sull'utilizzo dei modelli partner, consulta Esegui il deployment di un modello partner ed effettua richieste di previsione.

Kimi K2 Thinking Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Specifiche dell'API gestita (MaaS)

Esegui il deployment come modello con deployment autonomo

Kimi K2 Thinking