Kimi K2 Thinking

Kimi K2 Thinking è un modello open source che funziona come un "agente di ragionamento", ragionando passo dopo passo mentre utilizza strumenti per ottenere prestazioni all'avanguardia in vari benchmark. È in grado di eseguire fino a 200-300 chiamate di strumenti sequenziali senza intervento umano, consentendo di risolvere problemi complessi in un'ampia gamma di attività. Il modello utilizza l'addestramento quantizzazione consapevole (QAT) per supportare l'inferenza INT4, che offre un miglioramento di circa il doppio della velocità di generazione.

Visualizzare la scheda del modello in Model Garden

ID modello kimi-k2-thinking-maas
Fase di lancio GA
Ingressi e uscite supportati
  • Input:
    Testo, Documenti
  • Output:
    Testo
Funzionalità
Tipi di utilizzo
Versioni
  • Kimi K2 Thinking
    • Fase di lancio: GA
    • Data di uscita: 13 novembre 2025
Aree geografiche supportate

Disponibilità del modello

  • Regione
    • global

Elaborazione ML

  • Regione
    • Multi-region
Limiti

globale:

  • Output massimo: 262144
  • Lunghezza del contesto: 262144

Prezzi Vedi Prezzi.