Model MiniMax

Model MiniMax tersedia untuk digunakan sebagai API terkelola dan model yang di-deploy sendiri di Vertex AI. Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk melakukan streaming respons secara bertahap.

Model MiniMax terkelola

Model MiniMax menawarkan model serverless dan terkelola sepenuhnya sebagai API. Untuk menggunakan model MiniMax di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Saat menggunakan model MiniMax sebagai API terkelola, Anda tidak perlu menyediakan atau mengelola infrastruktur.

Model berikut tersedia dari MiniMax untuk digunakan di Vertex AI. Untuk mengakses model MiniMax, buka kartu modelnya di Model Garden.

MiniMax M2

MiniMax M2 adalah model dari MiniMax yang dirancang untuk tugas terkait kode dan agentik. Model ini dibuat untuk alur kerja pengembangan end-to-end dan memiliki kemampuan yang kuat dalam merencanakan dan menjalankan tugas panggilan alat yang kompleks. Model ini dioptimalkan untuk memberikan keseimbangan antara performa, biaya, dan kecepatan inferensi.

Buka kartu model MiniMax M2

Menggunakan model MiniMax

Untuk model terkelola, Anda dapat menggunakan perintah curl untuk mengirim permintaan ke endpoint Vertex AI menggunakan nama model berikut:

Untuk MiniMax M2, gunakan minimax-m2-maas

Untuk mempelajari cara melakukan panggilan streaming dan non-streaming ke model MiniMax, lihat Memanggil API model terbuka.

Untuk menggunakan model Vertex AI yang di-deploy sendiri:

Buka konsol Model Garden.
Temukan model Vertex AI yang relevan.
Klik Aktifkan dan isi formulir yang disediakan untuk mendapatkan lisensi penggunaan komersial yang diperlukan.

Untuk mengetahui informasi selengkapnya tentang men-deploy dan menggunakan model partner, lihat Men-deploy model partner dan membuat permintaan prediksi .

Ketersediaan wilayah model MiniMax

Model MiniMax tersedia di region berikut:

Model	Region
MiniMax M2	`global` Output maks: 196.608 Panjang konteks: 196.608

Langkah berikutnya

Pelajari cara Memanggil API model terbuka.

Model MiniMax Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.