O Kimi K2 Thinking é um modelo de código aberto que funciona como um "agente de reflexão", raciocinando passo a passo enquanto usa ferramentas para alcançar o melhor desempenho em vários testes de referência. É capaz de executar até 200 a 300 chamadas de ferramentas sequenciais sem intervenção humana, o que lhe permite resolver problemas complexos numa vasta gama de tarefas. O modelo usa a preparação com reconhecimento da quantização (QAT) para suportar a inferência INT4, o que proporciona uma melhoria de aproximadamente 2 vezes na velocidade de geração.
Especificações da API gerida (MaaS)
Veja o cartão do modelo no Model Garden
| ID do modelo | kimi-k2-thinking-maas |
|
|---|---|---|
| Fase de lançamento | DG | |
| Entradas e saídas suportadas |
|
|
| Capacidades |
|
|
| Tipos de utilização |
|
|
| Versões |
|
|
| Regiões suportadas | ||
|
Disponibilidade do modelo |
|
|
|
Processamento de ML |
|
|
| Limites |
global:
|
|
| Preços | Consulte os preços. | |
Implemente como um modelo autoimplementado
Para implementar o modelo autonomamente, navegue para o cartão do modelo Kimi K2 Thinking na consola do Model Garden e clique em Implementar modelo. Para mais informações sobre a implementação e a utilização de modelos de parceiros, consulte o artigo Implemente um modelo de parceiro e faça pedidos de previsão.