Model Kimi

Model Kimi tersedia untuk digunakan sebagai API terkelola dan model yang di-deploy sendiri di Vertex AI. Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk melakukan streaming respons secara bertahap.

Model Kimi terkelola

Model Kimi menawarkan model serverless yang terkelola sepenuhnya sebagai API. Untuk menggunakan model Kimi di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Saat menggunakan model Kimi sebagai API terkelola, Anda tidak perlu menyediakan atau mengelola infrastruktur.

Model berikut tersedia dari Kimi untuk digunakan di Vertex AI. Untuk mengakses model Kimi, buka kartu modelnya di Model Garden.

Kimi K2 Thinking

Kimi K2 Thinking adalah model pemikiran dari Kimi yang unggul dalam pemecahan masalah yang kompleks dan penalaran yang mendalam.

Buka kartu model Kimi K2 Thinking

Menggunakan model Kimi

Untuk model terkelola, Anda dapat menggunakan perintah curl untuk mengirim permintaan ke endpoint Vertex AI menggunakan nama model berikut:

  • Untuk Penalaran Kimi K2, gunakan kimi-k2-thinking-maas

Untuk mempelajari cara melakukan panggilan streaming dan non-streaming ke model Kimi, lihat Memanggil API model terbuka.

Untuk menggunakan model Vertex AI yang di-deploy sendiri:

  1. Buka konsol Model Garden.
  2. Temukan model Vertex AI yang relevan.
  3. Klik Aktifkan dan isi formulir yang disediakan untuk mendapatkan lisensi penggunaan komersial yang diperlukan.

Untuk mengetahui informasi selengkapnya tentang men-deploy dan menggunakan model partner, lihat Men-deploy model partner dan membuat permintaan prediksi .

Ketersediaan wilayah model Kimi

Model Kimi tersedia di region berikut:

Model Region
Kimi K2 Thinking
  • global
    • Output maks: 262.144
    • Panjang konteks: 262.144

Langkah berikutnya

Pelajari cara Memanggil API model terbuka.