Modelos do Kimi

Os modelos Kimi estão disponíveis para uso como APIs gerenciadas e modelos autoimplantados na Gemini Enterprise Agent Platform. É possível transmitir as respostas para reduzir a percepção de latência do usuário final. Uma resposta transmitida usa eventos enviados pelo servidor (SSE) para transmitir a resposta de forma incremental.

Modelos Kimi gerenciados

Os modelos Kimi oferecem modelos totalmente gerenciados e sem servidor como APIs. Para usar um modelo Kimi na Agent Platform, envie uma solicitação diretamente ao endpoint de API Agent Platform. Ao usar modelos Kimi como uma API gerenciada, não é necessário provisionar nem gerenciar a infraestrutura.

Os modelos a seguir estão disponíveis na Kimi para uso na Gemini Enterprise Agent Platform. Para acessar um modelo Kimi, acesse a Card de modelo do Model Garden.

Kimi K2 Thinking

O Kimi K2 Thinking é um modelo de pensamento da Kimi que se destaca na resolução de problemas complexos e no raciocínio profundo.

Acesse o card de modelo do Kimi K2 Thinking

Usar modelos Kimi

Para modelos gerenciados, é possível usar comandos curl para enviar solicitações ao endpoint da Gemini Enterprise Agent Platform usando os seguintes nomes de modelos:

  • Para o Kimi K2 Thinking, use kimi-k2-thinking-maas

Para saber como fazer chamadas de streaming e não streaming para modelos Kimi, consulte Chamar APIs de modelos abertos.

Para usar um modelo autoimplantado da Gemini Enterprise Agent Platform:

  1. Navegue até o console do Model Garden.
  2. Encontre o modelo relevante da Gemini Enterprise Agent Platform.
  3. Clique em Ativar e preencha o formulário fornecido para receber as licenças de uso comercial necessárias.

Para mais informações sobre como implantar e usar modelos de parceiros, consulte Implantar um modelo de parceiro e fazer solicitações de previsão .

Disponibilidade da região do modelo Kimi

Os modelos Kimi estão disponíveis nas seguintes regiões:

Modelo Regiões
Kimi K2 Thinking
  • global
    • Saída máxima: 262.144
    • Tamanho do contexto: 262.144

A seguir

Aprenda a chamar APIs de modelos abertos.