Kimi K2 Thinking

O Kimi K2 Thinking é um modelo de código aberto que funciona como um "agente de reflexão", raciocinando passo a passo enquanto usa ferramentas para alcançar o melhor desempenho em vários testes de referência. É capaz de executar até 200 a 300 chamadas de ferramentas sequenciais sem intervenção humana, o que lhe permite resolver problemas complexos numa vasta gama de tarefas. O modelo usa a preparação com reconhecimento da quantização (QAT) para suportar a inferência INT4, o que proporciona uma melhoria de aproximadamente 2 vezes na velocidade de geração.

Especificações da API gerida (MaaS)

Veja o cartão do modelo no Model Garden

Regiões suportadas
ID do modelo	`kimi-k2-thinking-maas`
Fase de lançamento	DG
Entradas e saídas suportadas	Entradas: Texto, Documentos Saídas: Texto
Capacidades	Suportado Chamada de funções Saída estruturada A pensar Não suportado Previsões em lote
Tipos de utilização	Suportado Quota partilhada dinâmica Débito aprovisionado Não suportado Quota fixa
Versões	`Kimi K2 Thinking` Fase de lançamento: GA Data de lançamento: 13 de novembro de 2025
	Disponibilidade do modelo	Região `global`
	Processamento de ML	Região `Multi-region`
Limites	global: Saída máxima: 262144 Comprimento do contexto: 262144
Preços	Consulte os preços.

Implemente como um modelo autoimplementado

Para implementar o modelo autonomamente, navegue para o cartão do modelo Kimi K2 Thinking na consola do Model Garden e clique em Implementar modelo. Para mais informações sobre a implementação e a utilização de modelos de parceiros, consulte o artigo Implemente um modelo de parceiro e faça pedidos de previsão.

Kimi K2 Thinking Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Especificações da API gerida (MaaS)

Implemente como um modelo autoimplementado

Kimi K2 Thinking