Kimi K2 Thinking

O Kimi K2 Thinking é um modelo de código aberto que funciona como um "agente de reflexão", raciocinando passo a passo enquanto usa ferramentas para alcançar o melhor desempenho em vários testes de referência. É capaz de executar até 200 a 300 chamadas de ferramentas sequenciais sem intervenção humana, o que lhe permite resolver problemas complexos numa vasta gama de tarefas. O modelo usa a técnica de Quantization-Aware Training (QAT) para suportar a inferência INT4, o que proporciona uma melhoria de aproximadamente 2 vezes na velocidade de geração.

Veja o cartão do modelo no Model Garden

ID do modelo kimi-k2-thinking-maas
Fase de lançamento DG
Entradas e saídas suportadas
  • Entradas:
    Texto, Documentos
  • Saídas:
    Texto
Capacidades
Tipos de utilização
Versões
  • Kimi K2 Thinking
    • Fase de lançamento: GA
    • Data de lançamento: 13 de novembro de 2025
Regiões suportadas

Disponibilidade do modelo

  • Região
    • global

Processamento de ML

  • Região
    • Multi-region
Limites

global:

  • Saída máxima: 262144
  • Comprimento do contexto: 262144

Preços Consulte os preços.