Kimi K2 Thinking

O Kimi K2 Thinking é um modelo de código aberto que funciona como um "agente de pensamento", raciocinando etapa por etapa enquanto usa ferramentas para alcançar um desempenho de ponta em vários comparativos. Ele é capaz de executar até 200 a 300 chamadas de ferramentas sequenciais sem intervenção humana, permitindo resolver problemas complexos em uma ampla variedade de tarefas. O modelo usa o treinamento com reconhecimento de quantização (QAT, na sigla em inglês) para oferecer suporte à inferência INT4, o que proporciona uma melhoria de aproximadamente 2 vezes na velocidade de geração.

Especificações da API gerenciada (MaaS)

Ver o card de modelo no Model Garden

Regiões compatíveis
ID do modelo	`kimi-k2-thinking-maas`
Etapa do lançamento	GA
Entradas e saídas compatíveis	Entradas: Texto, Documentos Saídas: Texto
Recursos	Sim Chamadas de função Saída estruturada Pensar Sem suporte Previsões em lote
Tipos de uso	Sim Cota compartilhada dinâmica Capacidade de processamento provisionada Sem suporte Cota fixa
Versões	`Kimi K2 Thinking` Estágio de lançamento:disponibilidade geral Data de lançamento:13 de novembro de 2025
	Disponibilidade do modelo	Região `global`
	Processamento de ML	Região `Multi-region`
Limites	global: Saída máxima: 262144 Tamanho do contexto: 262144
Preços	Consulte a seção Preços.

Implantar como um modelo autônomo

Para implantar o modelo por conta própria, acesse o card do modelo Kimi K2 Thinking no console do Model Garden e clique em Implantar modelo. Para mais informações sobre como implantar e usar modelos de parceiros, consulte Implantar um modelo de parceiro e fazer solicitações de previsão.

Kimi K2 Thinking Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Especificações da API gerenciada (MaaS)

Implantar como um modelo autônomo

Kimi K2 Thinking