Vertex AI mendukung daftar model partner dan model terbuka yang telah dikurasi sebagai model terkelola. Model ini dapat digunakan dengan Vertex AI sebagai model sebagai layanan (MaaS) dan ditawarkan sebagai API terkelola. Saat menggunakan model terkelola, Anda tetap mengirim permintaan ke endpoint Vertex AI. Model terkelola bersifat serverless sehingga tidak perlu menyediakan atau mengelola infrastruktur.
Model terkelola dapat ditemukan menggunakan Model Garden. Anda juga dapat men-deploy model menggunakan Model Garden. Untuk mengetahui informasi selengkapnya, lihat Menjelajahi model AI di Model Garden.
Model partner
Model partner berikut ditawarkan sebagai API terkelola di Model Garden (MaaS) Vertex AI:
| Nama model | Pengandaian | Deskripsi | Panduan Memulai |
|---|---|---|---|
| Claude Opus 4.5 | Bahasa, Visi | Model Anthropic tercerdas generasi berikutnya, Claude Opus 4.5 adalah pemimpin industri dalam coding, agen, penggunaan komputer, dan alur kerja perusahaan. | Kartu model |
| Claude Sonnet 4.5 | Bahasa, Visi | Model berukuran sedang Anthropic untuk mendukung agen dunia nyata, dengan kemampuan dalam coding, penggunaan komputer, keamanan siber, dan bekerja dengan file kantor seperti spreadsheet. | Kartu model |
| Claude Opus 4.1 | Bahasa, Visi | Pemimpin industri untuk coding. Agen ini memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga memperluas kemampuan agen AI secara signifikan. Ideal untuk mendukung produk dan fitur agen canggih. | Kartu model |
| Claude Haiku 4.5 | Bahasa, Visi | Claude Haiku 4.5 memberikan performa mendekati batas kemampuan untuk berbagai kasus penggunaan, dan menonjol sebagai salah satu model coding terbaik di dunia–dengan kecepatan dan biaya yang tepat untuk mendukung produk gratis dan pengalaman pengguna bervolume tinggi. | Kartu model |
| Claude Opus 4 | Bahasa, Visi | Claude Opus 4 memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga secara signifikan memperluas kemampuan agen AI dalam menyelesaikan masalah. | Kartu model |
| Claude Sonnet 4 | Bahasa, Visi | Model berukuran sedang dari Anthropic dengan kecerdasan yang lebih unggul untuk penggunaan bervolume tinggi, seperti coding, riset mendalam, dan agen. | Kartu model |
| Claude 3.5 Sonnet v2 dari Anthropic | Bahasa, Visi | Claude 3.5 Sonnet yang telah diupgrade adalah model canggih untuk tugas-tugas software engineering di dunia nyata dan kemampuan agentic. Claude 3.5 Sonnet menghadirkan peningkatan ini dengan harga dan kecepatan yang sama seperti pendahulunya. | Kartu model |
| Claude 3.5 Haiku dari Anthropic | Bahasa, Visi | Claude 3.5 Haiku, model Anthropic generasi berikutnya yang paling cepat dan hemat biaya, optimal untuk kasus penggunaan yang membutuhkan kecepatan dan keterjangkauan. | Kartu model |
| Claude 3 Haiku dari Anthropic | Bahasa | Model teks dan visi tercepat dari Anthropic untuk merespons kueri dasar secara instan, yang ditujukan untuk pengalaman AI yang lancar yang meniru interaksi manusia. | Kartu model |
| Claude 3.5 Sonnet dari Anthropic | Bahasa | Claude 3.5 Sonnet mengungguli Claude 3 Opus Anthropic di berbagai evaluasi Anthropic dengan kecepatan dan biaya layaknya model tingkat menengah Anthropic, Claude 3 Sonnet. | Kartu model |
| Jamba 1.5 Large (Pratinjau) | Bahasa | Jamba 1.5 Large dari AI21 Labs dirancang untuk memberikan respons berkualitas tinggi, throughput tinggi, dan harga yang kompetitif dibandingkan dengan model lain dalam kelas ukurannya. | Kartu model |
| Jamba 1.5 Mini (Pratinjau) | Bahasa | Jamba 1.5 Mini dari AI21 Labs memiliki keseimbangan yang baik antara kualitas, throughput, dan biaya rendah. | Kartu model |
| Mistral Medium 3 | Bahasa | Mistral Medium 3 adalah model serbaguna yang dirancang untuk berbagai tugas, termasuk pemrograman, penalaran matematika, pemahaman dokumen panjang, perangkuman, dan dialog. | Kartu model |
| Mistral OCR (25.05) | Bahasa, Visi | Mistral OCR (25.05) adalah API Pengenalan Karakter Optik untuk pemahaman dokumen. Model memahami setiap elemen dokumen seperti media, teks, tabel, dan persamaan. | Kartu model |
| Mistral Small 3.1 (25.03) | Bahasa | Mistral Small 3.1 (25.03) adalah versi terbaru dari model Small Mistral, yang menampilkan kemampuan multimodal dan panjang konteks yang diperluas. | Kartu model |
| Mistral Large (24.11) | Bahasa | Mistral Large (24.11) adalah versi berikutnya dari model Mistral Large (24.07) yang kini memiliki kemampuan penalaran dan pemanggilan fungsi yang lebih baik. | Kartu model |
| Codestral 2 | Bahasa, Kode | Codestral 2 adalah model khusus pembuatan kode Mistral yang dibuat khusus untuk penyelesaian isi di tengah (FIM) dengan presisi tinggi yang membantu developer menulis dan berinteraksi dengan kode melalui endpoint API penyelesaian dan instruksi bersama. | Kartu model |
| Codestral (25.01) | Kode | Model canggih yang dirancang untuk pembuatan kode, termasuk pengisian di tengah dan penyelesaian kode. | Kartu model |
Model terbuka
Model terbuka berikut ditawarkan sebagai API terkelola di Vertex AI Model Garden (MaaS):
| Nama model | Pengandaian | Deskripsi | Panduan Memulai |
|---|---|---|---|
| DeepSeek-OCR | Bahasa, Visi | Model Pengenalan Karakter Optik (OCR) komprehensif yang menganalisis dan memahami dokumen kompleks. Model ini unggul dalam tugas OCR yang sulit. | Kartu model |
| DeepSeek R1 (0528) | Bahasa | Versi terbaru model DeepSeek R1 dari DeepSeek. | Kartu model |
| DeepSeek-V3.1 | Bahasa | Model hybrid DeepSeek yang mendukung mode berpikir dan mode non-berpikir. | Kartu model |
| gpt-oss 120B | Bahasa | Model 120B yang menawarkan performa tinggi dalam tugas penalaran. | Kartu model |
| gpt-oss 20B | Bahasa | Model 20B yang dioptimalkan untuk efisiensi dan deployment di hardware konsumen dan edge. | Kartu model |
| Kimi K2 Thinking | Bahasa | Model agen pemikiran open source yang bernalar langkah demi langkah dan menggunakan alat untuk memecahkan masalah yang kompleks. | Kartu model |
| Llama 3.1 | Bahasa |
Kumpulan LLM multibahasa yang dioptimalkan untuk kasus penggunaan dialog multibahasa dan mengungguli banyak model chat open source dan tertutup yang tersedia pada tolok ukur industri umum. Llama 3.1 405B tersedia secara umum (GA). Llama 3.1 8B dan Llama 3.1 70B tersedia dalam Pratinjau. |
Kartu model |
| Llama 3.2 (Pratinjau) | Bahasa, Visi | Model multimodal berukuran sedang 90B yang dapat mendukung penalaran gambar, seperti analisis diagram dan grafik serta pemberian teks gambar. | Kartu model |
| Llama 3.3 | Bahasa | Llama 3.3 adalah model yang disesuaikan untuk perintah 70B khusus teks yang memberikan peningkatan performa dibandingkan Llama 3.1 70B dan Llama 3.2 90B saat digunakan untuk aplikasi khusus teks. Selain itu, untuk beberapa aplikasi, Llama 3.3 70B mendekati performa Llama 3.1 405B. | Kartu model |
| Llama 4 Maverick 17B-128E | Bahasa, Visi | Model Llama 4 terbesar dan paling mumpuni yang memiliki kemampuan pengkodean, penalaran, dan gambar. Llama 4 Maverick 17B-128E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan fusi awal. | Kartu model |
| Llama 4 Scout 17B-16E | Bahasa, Visi | Llama 4 Scout 17B-16E memberikan hasil terbaik untuk kelas ukurannya, mengungguli generasi Llama sebelumnya dan model terbuka serta berpemilik lainnya pada beberapa tolok ukur. Llama 4 Scout 17B-16E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan penggabungan awal. | Kartu model |
| MiniMax M2 | Bahasa, Kode | Dirancang untuk tugas agentic dan terkait kode dengan kemampuan yang kuat dalam merencanakan dan menjalankan tugas pemanggilan alat yang kompleks. | Kartu model |
| Qwen3 235B | Bahasa | Model berat terbuka dengan kemampuan "pemikiran hibrida" untuk beralih antara penalaran metodis dan percakapan cepat. | Kartu model |
| Qwen3 Coder | Bahasa, Kode | Model dengan bobot terbuka yang dikembangkan untuk tugas pengembangan software tingkat lanjut. | Kartu model |
| Qwen3-Next-80B Instruct | Bahasa, Kode | Model dari kelompok model Qwen3-Next, yang dikhususkan untuk mengikuti perintah tertentu. | Kartu model |
| Qwen3-Next-80B Berpikir | Bahasa, Kode | Model dari rangkaian model Qwen3-Next, yang dikhususkan untuk pemecahan masalah yang kompleks dan penalaran yang mendalam. | Kartu model |
Langkah berikutnya
- Pelajari lebih lanjut model terbuka Vertex AI untuk MaaS.
- Pelajari cara Memanggil API model terbuka.