Kimi K2 Thinking

O Kimi K2 Thinking é um modelo de código aberto que funciona como um "agente de pensamento", raciocinando etapa por etapa enquanto usa ferramentas para alcançar um desempenho de ponta em vários comparativos. Ele é capaz de executar até 200 a 300 chamadas de ferramentas sequenciais sem intervenção humana, o que permite resolver problemas complexos em uma ampla variedade de tarefas. O modelo usa o treinamento com reconhecimento de quantização (QAT, na sigla em inglês) para oferecer suporte à inferência INT4, o que proporciona uma melhoria de aproximadamente 2 vezes na velocidade de geração.

Ver o card de modelo no Model Garden

ID do modelo kimi-k2-thinking-maas
Etapa do lançamento GA
Entradas e saídas compatíveis
  • Entradas:
    Texto, Documentos
  • Saídas:
    Texto
Recursos
Tipos de uso
Versões
  • Kimi K2 Thinking
    • Estágio de lançamento:disponibilidade geral
    • Data de lançamento:13 de novembro de 2025
Regiões compatíveis

Disponibilidade do modelo

  • Região
    • global

Processamento de ML

  • Região
    • Multi-region
Limites

global:

  • Saída máxima: 262144
  • Tamanho do contexto: 262144

Preços Consulte a seção Preços.