Model Google di Vertex AI menawarkan model sebagai API yang terkelola sepenuhnya dan serverless. Untuk menggunakan model Google di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Karena model Google menggunakan API terkelola, Anda tidak perlu menyediakan atau mengelola infrastruktur.
Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk mengalirkan respons secara bertahap.
Gemma 4 26B A4B IT
Gemma 4 26B A4B IT adalah model multimodal dari Google yang menangani input teks dan gambar serta menghasilkan output teks.
Buka kartu model IT A4B Gemma 4 26BMenggunakan model Google
Untuk model terkelola, Anda dapat menggunakan perintah curl untuk mengirim permintaan ke endpoint Vertex AI menggunakan nama model berikut:
- Untuk Gemma 4 26B A4B IT, gunakan
gemma-4-26b-a4b-it-maas
Untuk mempelajari cara melakukan panggilan streaming dan non-streaming ke model Google, lihat Memanggil API model terbuka.
Untuk menggunakan model Vertex AI yang di-deploy sendiri:
- Buka konsol Model Garden.
- Temukan model Vertex AI yang relevan.
- Klik Aktifkan dan isi formulir yang disediakan untuk mendapatkan lisensi penggunaan komersial yang diperlukan.
Untuk mengetahui informasi selengkapnya tentang men-deploy dan menggunakan model partner, lihat Men-deploy model partner dan membuat permintaan prediksi .
Ketersediaan wilayah model Google
Model Google tersedia di wilayah berikut:
| Model | Region |
|---|---|
| Gemma 4 26B A4B IT |
|
Langkah berikutnya
Pelajari cara Memanggil API model terbuka.