Kimi K2 Thinking

O Kimi K2 Thinking é um modelo de código aberto que funciona como um "agente de reflexão", raciocinando passo a passo enquanto usa ferramentas para alcançar o melhor desempenho em vários testes de referência. É capaz de executar até 200 a 300 chamadas de ferramentas sequenciais sem intervenção humana, o que lhe permite resolver problemas complexos numa vasta gama de tarefas. O modelo usa a preparação com reconhecimento da quantização (QAT) para suportar a inferência INT4, o que proporciona uma melhoria de aproximadamente 2 vezes na velocidade de geração.

Especificações da API gerida (MaaS)

Veja o cartão do modelo no Model Garden

ID do modelo kimi-k2-thinking-maas
Fase de lançamento DG
Entradas e saídas suportadas
  • Entradas:
    Texto, Documentos
  • Saídas:
    Texto
Capacidades
Tipos de utilização
Versões
  • Kimi K2 Thinking
    • Fase de lançamento: GA
    • Data de lançamento: 13 de novembro de 2025
Regiões suportadas

Disponibilidade do modelo

  • Região
    • global

Processamento de ML

  • Região
    • Multi-region
Limites

global:

  • Saída máxima: 262144
  • Comprimento do contexto: 262144

Preços Consulte os preços.

Implemente como um modelo autoimplementado

Para implementar o modelo autonomamente, navegue para o cartão do modelo Kimi K2 Thinking na consola do Model Garden e clique em Implementar modelo. Para mais informações sobre a implementação e a utilização de modelos de parceiros, consulte o artigo Implemente um modelo de parceiro e faça pedidos de previsão.