Modelos de Kimi

Los modelos de Kimi están disponibles para usarse como APIs administradas y modelos autoimplementados en Gemini Enterprise Agent Platform. Puedes transmitir tus respuestas para reducir la percepción de latencia del usuario final. Una respuesta transmitida usa eventos enviados por el servidor (SSE) para transmitir la respuesta de forma incremental.

Modelos de Kimi administrados

Los modelos de Kimi ofrecen modelos completamente administrados y sin servidores como APIs. Para usar un modelo de Kimi en Agent Platform, envía una solicitud directamente al extremo de API de Agent Platform. Cuando se usan modelos de Kimi como una API administrada, no es necesario aprovisionar ni administrar la infraestructura.

Los siguientes modelos están disponibles en Kimi para usarlos en Gemini Enterprise Agent Platform. Para acceder a un modelo de Kimi, ve a su ficha del modelo de Model Garden.

Kimi K2 Thinking

Kimi K2 Thinking es un modelo de razonamiento de Kimi que se destaca en la resolución de problemas complejos y el razonamiento profundo.

Ir a la ficha del modelo de razonamiento Kimi K2

Usa modelos de Kimi

Para los modelos administrados, puedes usar comandos curl para enviar solicitudes al extremo de Gemini Enterprise Agent Platform con los siguientes nombres de modelos:

  • Para Kimi K2 Thinking, usa kimi-k2-thinking-maas.

Para obtener información sobre cómo realizar llamadas de transmisión y no transmisión a los modelos de Kimi, consulta Llama a las APIs de modelos abiertos.

Para usar un modelo de Gemini Enterprise Agent Platform autoimplementado, haz lo siguiente:

  1. Navega a la consola de Model Garden.
  2. Busca el modelo de Gemini Enterprise Agent Platform pertinente.
  3. Haz clic en Habilitar y completa el formulario proporcionado para obtener las licencias de uso comercial necesarias.

Para obtener más información sobre la implementación y el uso de modelos de socios, consulta Implementa un modelo de socio y realiza solicitudes de predicción .

Disponibilidad regional del modelo de Kimi

Los modelos de Kimi están disponibles en las siguientes regiones:

Modelo Regiones
Kimi K2 Thinking
  • global
    • Salida máxima: 262,144
    • Longitud del contexto: 262,144

¿Qué sigue?

Consulta cómo llamar a las APIs de modelos abiertos.