Model terkelola Vertex AI untuk MaaS

Vertex AI mendukung daftar model partner dan model terbuka yang telah dikurasi sebagai model terkelola. Model ini dapat digunakan dengan Vertex AI sebagai model sebagai layanan (MaaS) dan ditawarkan sebagai API terkelola. Saat menggunakan model terkelola, Anda tetap mengirim permintaan ke endpoint Vertex AI. Model terkelola bersifat serverless sehingga tidak perlu menyediakan atau mengelola infrastruktur.

Model terkelola dapat ditemukan menggunakan Model Garden. Anda juga dapat men-deploy model menggunakan Model Garden. Untuk mengetahui informasi selengkapnya, lihat Menjelajahi model AI di Model Garden.

Model partner

Model partner berikut ditawarkan sebagai API terkelola di Model Garden (MaaS) Vertex AI:

Nama model Pengandaian Deskripsi Panduan Memulai
Claude Opus 4.5 Bahasa, Visi Model Anthropic tercerdas generasi berikutnya, Claude Opus 4.5 adalah pemimpin industri dalam coding, agen, penggunaan komputer, dan alur kerja perusahaan. Kartu model
Claude Sonnet 4.5 Bahasa, Visi Model berukuran sedang Anthropic untuk mendukung agen dunia nyata, dengan kemampuan dalam coding, penggunaan komputer, keamanan siber, dan bekerja dengan file kantor seperti spreadsheet. Kartu model
Claude Opus 4.1 Bahasa, Visi Pemimpin industri untuk coding. Agen ini memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga memperluas kemampuan agen AI secara signifikan. Ideal untuk mendukung produk dan fitur agen canggih. Kartu model
Claude Haiku 4.5 Bahasa, Visi Claude Haiku 4.5 memberikan performa mendekati batas kemampuan untuk berbagai kasus penggunaan, dan menonjol sebagai salah satu model coding terbaik di dunia–dengan kecepatan dan biaya yang tepat untuk mendukung produk gratis dan pengalaman pengguna bervolume tinggi. Kartu model
Claude Opus 4 Bahasa, Visi Claude Opus 4 memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga secara signifikan memperluas kemampuan agen AI dalam menyelesaikan masalah. Kartu model
Claude Sonnet 4 Bahasa, Visi Model berukuran sedang dari Anthropic dengan kecerdasan yang lebih unggul untuk penggunaan bervolume tinggi, seperti coding, riset mendalam, dan agen. Kartu model
Claude 3.5 Sonnet v2 dari Anthropic Bahasa, Visi Claude 3.5 Sonnet yang telah diupgrade adalah model canggih untuk tugas-tugas software engineering di dunia nyata dan kemampuan agentic. Claude 3.5 Sonnet menghadirkan peningkatan ini dengan harga dan kecepatan yang sama seperti pendahulunya. Kartu model
Claude 3.5 Haiku dari Anthropic Bahasa, Visi Claude 3.5 Haiku, model Anthropic generasi berikutnya yang paling cepat dan hemat biaya, optimal untuk kasus penggunaan yang membutuhkan kecepatan dan keterjangkauan. Kartu model
Claude 3 Haiku dari Anthropic Bahasa Model teks dan visi tercepat dari Anthropic untuk merespons kueri dasar secara instan, yang ditujukan untuk pengalaman AI yang lancar yang meniru interaksi manusia. Kartu model
Claude 3.5 Sonnet dari Anthropic Bahasa Claude 3.5 Sonnet mengungguli Claude 3 Opus Anthropic di berbagai evaluasi Anthropic dengan kecepatan dan biaya layaknya model tingkat menengah Anthropic, Claude 3 Sonnet. Kartu model
Jamba 1.5 Large (Pratinjau) Bahasa Jamba 1.5 Large dari AI21 Labs dirancang untuk memberikan respons berkualitas tinggi, throughput tinggi, dan harga yang kompetitif dibandingkan dengan model lain dalam kelas ukurannya. Kartu model
Jamba 1.5 Mini (Pratinjau) Bahasa Jamba 1.5 Mini dari AI21 Labs memiliki keseimbangan yang baik antara kualitas, throughput, dan biaya rendah. Kartu model
Mistral Medium 3 Bahasa Mistral Medium 3 adalah model serbaguna yang dirancang untuk berbagai tugas, termasuk pemrograman, penalaran matematika, pemahaman dokumen panjang, perangkuman, dan dialog. Kartu model
Mistral OCR (25.05) Bahasa, Visi Mistral OCR (25.05) adalah API Pengenalan Karakter Optik untuk pemahaman dokumen. Model memahami setiap elemen dokumen seperti media, teks, tabel, dan persamaan. Kartu model
Mistral Small 3.1 (25.03) Bahasa Mistral Small 3.1 (25.03) adalah versi terbaru dari model Small Mistral, yang menampilkan kemampuan multimodal dan panjang konteks yang diperluas. Kartu model
Mistral Large (24.11) Bahasa Mistral Large (24.11) adalah versi berikutnya dari model Mistral Large (24.07) yang kini memiliki kemampuan penalaran dan pemanggilan fungsi yang lebih baik. Kartu model
Codestral 2 Bahasa, Kode Codestral 2 adalah model khusus pembuatan kode Mistral yang dibuat khusus untuk penyelesaian isi di tengah (FIM) dengan presisi tinggi yang membantu developer menulis dan berinteraksi dengan kode melalui endpoint API penyelesaian dan instruksi bersama. Kartu model
Codestral (25.01) Kode Model canggih yang dirancang untuk pembuatan kode, termasuk pengisian di tengah dan penyelesaian kode. Kartu model

Model terbuka

Model terbuka berikut ditawarkan sebagai API terkelola di Vertex AI Model Garden (MaaS):

Nama model Pengandaian Deskripsi Panduan Memulai
DeepSeek-OCR Bahasa, Visi Model Pengenalan Karakter Optik (OCR) komprehensif yang menganalisis dan memahami dokumen kompleks. Model ini unggul dalam tugas OCR yang sulit. Kartu model
DeepSeek R1 (0528) Bahasa Versi terbaru model DeepSeek R1 dari DeepSeek. Kartu model
DeepSeek-V3.1 Bahasa Model hybrid DeepSeek yang mendukung mode berpikir dan mode non-berpikir. Kartu model
gpt-oss 120B Bahasa Model 120B yang menawarkan performa tinggi dalam tugas penalaran. Kartu model
gpt-oss 20B Bahasa Model 20B yang dioptimalkan untuk efisiensi dan deployment di hardware konsumen dan edge. Kartu model
Kimi K2 Thinking Bahasa Model agen pemikiran open source yang bernalar langkah demi langkah dan menggunakan alat untuk memecahkan masalah yang kompleks. Kartu model
Llama 3.1 Bahasa

Kumpulan LLM multibahasa yang dioptimalkan untuk kasus penggunaan dialog multibahasa dan mengungguli banyak model chat open source dan tertutup yang tersedia pada tolok ukur industri umum.

Llama 3.1 405B tersedia secara umum (GA).

Llama 3.1 8B dan Llama 3.1 70B tersedia dalam Pratinjau.

Kartu model
Llama 3.2 (Pratinjau) Bahasa, Visi Model multimodal berukuran sedang 90B yang dapat mendukung penalaran gambar, seperti analisis diagram dan grafik serta pemberian teks gambar. Kartu model
Llama 3.3 Bahasa Llama 3.3 adalah model yang disesuaikan untuk perintah 70B khusus teks yang memberikan peningkatan performa dibandingkan Llama 3.1 70B dan Llama 3.2 90B saat digunakan untuk aplikasi khusus teks. Selain itu, untuk beberapa aplikasi, Llama 3.3 70B mendekati performa Llama 3.1 405B. Kartu model
Llama 4 Maverick 17B-128E Bahasa, Visi Model Llama 4 terbesar dan paling mumpuni yang memiliki kemampuan pengkodean, penalaran, dan gambar. Llama 4 Maverick 17B-128E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan fusi awal. Kartu model
Llama 4 Scout 17B-16E Bahasa, Visi Llama 4 Scout 17B-16E memberikan hasil terbaik untuk kelas ukurannya, mengungguli generasi Llama sebelumnya dan model terbuka serta berpemilik lainnya pada beberapa tolok ukur. Llama 4 Scout 17B-16E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan penggabungan awal. Kartu model
MiniMax M2 Bahasa, Kode Dirancang untuk tugas agentic dan terkait kode dengan kemampuan yang kuat dalam merencanakan dan menjalankan tugas pemanggilan alat yang kompleks. Kartu model
Qwen3 235B Bahasa Model berat terbuka dengan kemampuan "pemikiran hibrida" untuk beralih antara penalaran metodis dan percakapan cepat. Kartu model
Qwen3 Coder Bahasa, Kode Model dengan bobot terbuka yang dikembangkan untuk tugas pengembangan software tingkat lanjut. Kartu model
Qwen3-Next-80B Instruct Bahasa, Kode Model dari kelompok model Qwen3-Next, yang dikhususkan untuk mengikuti perintah tertentu. Kartu model
Qwen3-Next-80B Berpikir Bahasa, Kode Model dari rangkaian model Qwen3-Next, yang dikhususkan untuk pemecahan masalah yang kompleks dan penalaran yang mendalam. Kartu model

Langkah berikutnya