O Kimi K2 Thinking é um modelo de código aberto que funciona como um "agente de pensamento", raciocinando etapa por etapa enquanto usa ferramentas para alcançar um desempenho de ponta em vários comparativos. Ele é capaz de executar até 200 a 300 chamadas de ferramentas sequenciais sem intervenção humana, permitindo resolver problemas complexos em uma ampla variedade de tarefas. O modelo usa o treinamento com reconhecimento de quantização (QAT, na sigla em inglês) para oferecer suporte à inferência INT4, o que proporciona uma melhoria de aproximadamente 2 vezes na velocidade de geração.
Especificações da API gerenciada (MaaS)
Ver o card de modelo no Model Garden
| ID do modelo | kimi-k2-thinking-maas |
|
|---|---|---|
| Etapa do lançamento | GA | |
| Entradas e saídas compatíveis |
|
|
| Recursos |
|
|
| Tipos de uso | ||
| Versões |
|
|
| Regiões compatíveis | ||
|
Disponibilidade do modelo |
|
|
|
Processamento de ML |
|
|
| Limites |
global:
|
|
| Preços | Consulte a seção Preços. | |
Implantar como um modelo autônomo
Para implantar o modelo por conta própria, acesse o card do modelo Kimi K2 Thinking no console do Model Garden e clique em Implantar modelo. Para mais informações sobre como implantar e usar modelos de parceiros, consulte Implantar um modelo de parceiro e fazer solicitações de previsão.