Model MiniMax tersedia untuk digunakan sebagai API terkelola dan model yang di-deploy sendiri di Vertex AI. Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk melakukan streaming respons secara bertahap.
Model MiniMax terkelola
Model MiniMax menawarkan model serverless dan terkelola sepenuhnya sebagai API. Untuk menggunakan model MiniMax di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Saat menggunakan model MiniMax sebagai API terkelola, Anda tidak perlu menyediakan atau mengelola infrastruktur.
Model berikut tersedia dari MiniMax untuk digunakan di Vertex AI. Untuk mengakses model MiniMax, buka kartu modelnya di Model Garden.
MiniMax M2
MiniMax M2 adalah model dari MiniMax yang dirancang untuk tugas terkait kode dan agentik. Model ini dibuat untuk alur kerja pengembangan end-to-end dan memiliki kemampuan yang kuat dalam merencanakan dan menjalankan tugas panggilan alat yang kompleks. Model ini dioptimalkan untuk memberikan keseimbangan antara performa, biaya, dan kecepatan inferensi.
Buka kartu model MiniMax M2Menggunakan model MiniMax
Untuk model terkelola, Anda dapat menggunakan perintah curl untuk mengirim permintaan ke endpoint Vertex AI menggunakan nama model berikut:
- Untuk MiniMax M2, gunakan
minimax-m2-maas
Untuk mempelajari cara melakukan panggilan streaming dan non-streaming ke model MiniMax, lihat Memanggil API model terbuka.
Untuk menggunakan model Vertex AI yang di-deploy sendiri:
- Buka konsol Model Garden.
- Temukan model Vertex AI yang relevan.
- Klik Aktifkan dan isi formulir yang disediakan untuk mendapatkan lisensi penggunaan komersial yang diperlukan.
Untuk mengetahui informasi selengkapnya tentang men-deploy dan menggunakan model partner, lihat Men-deploy model partner dan membuat permintaan prediksi .
Ketersediaan wilayah model MiniMax
Model MiniMax tersedia di region berikut:
| Model | Region |
|---|---|
| MiniMax M2 |
|
Langkah berikutnya
Pelajari cara Memanggil API model terbuka.