Modelos de Kimi

Los modelos de Kimi se pueden usar como APIs gestionadas y modelos autodesplegados en Vertex AI. Puedes transmitir tus respuestas para reducir la percepción de latencia del usuario final. Una respuesta transmitida usa eventos enviados por el servidor (SSE) para transmitir la respuesta de forma incremental.

Modelos de Kimi gestionados

Los modelos de Kimi ofrecen modelos totalmente gestionados y sin servidor como APIs. Para usar un modelo de Kimi en Vertex AI, envía una solicitud directamente al endpoint de la API de Vertex AI. Si usas los modelos de Kimi como una API gestionada, no tendrás que aprovisionar ni gestionar ninguna infraestructura.

Kimi ofrece los siguientes modelos para usar en Vertex AI. Para acceder a un modelo de Kimi, ve a su tarjeta de modelo de Model Garden.

Kimi K2 Thinking

Kimi K2 Thinking es un modelo de pensamiento de Kimi que destaca en la resolución de problemas complejos y el razonamiento profundo.

Ir a la tarjeta del modelo Kimi K2 Thinking

Usar modelos de Kimi

En el caso de los modelos gestionados, puedes usar comandos curl para enviar solicitudes al endpoint de Vertex AI con los siguientes nombres de modelo:

Para usar Kimi K2 Thinking, usa kimi-k2-thinking-maas

Para saber cómo hacer llamadas de streaming y no de streaming a los modelos de Kimi, consulta Llamar a APIs de modelos abiertos.

Para usar un modelo de Vertex AI autodesplegado, sigue estos pasos:

Ve a la consola Model Garden.
Busca el modelo de Vertex AI pertinente.
Haz clic en Habilitar y rellena el formulario proporcionado para obtener las licencias de uso comercial necesarias.

Para obtener más información sobre cómo implementar y usar modelos de partners, consulta Implementar un modelo de partner y enviar solicitudes de predicción.

Disponibilidad y cuotas de regiones del modelo Kimi

En el caso de los modelos de Kimi, se aplica una cuota a cada región en la que esté disponible el modelo. La cuota se especifica en consultas por minuto (CPM).

Modelo	Región	Cuotas	Longitud del contexto
Kimi K2 Thinking
Kimi K2 Thinking	`global`		262144

Si quieres aumentar alguna de tus cuotas de IA generativa en Vertex AI, puedes solicitarlo a través de la Google Cloud consola. Para obtener más información sobre las cuotas, consulta la descripción general de las cuotas de Cloud.

Siguientes pasos

Consulta cómo llamar a APIs de modelos abiertos.

Modelos de Kimi Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.