Platform Agen Gemini Enterprise mendukung daftar model pilihan yang dikembangkan oleh partner Google. Model partner dapat digunakan dengan Platform Agen Gemini Enterprise sebagai model as a service (MaaS) dan ditawarkan sebagai API terkelola. Saat menggunakan model partner, Anda akan terus mengirim permintaan ke endpoint Platform Agen Gemini Enterprise. Model partner bersifat serverless sehingga Anda tidak perlu menyediakan atau mengelola infrastruktur.
Model partner dapat ditemukan menggunakan Model Garden. Anda juga dapat men-deploy model menggunakan Model Garden. Untuk mengetahui informasi selengkapnya, lihat Mempelajari model AI di Model Garden. Meskipun informasi tentang setiap model partner yang tersedia dapat ditemukan di kartu modelnya di Model Garden, hanya model pihak ketiga yang berperforma sebagai MaaS dengan Platform Agen Gemini Enterprise yang didokumentasikan dalam panduan ini.
Model Claude dan Mistral dari Anthropic adalah contoh model terkelola pihak ketiga yang tersedia untuk digunakan di Platform Agen Gemini Enterprise.
Model partner
Model partner berikut ditawarkan sebagai API terkelola di Gemini Enterprise Agent Platform Model Garden (MaaS):
| Nama model | Pengandaian | Deskripsi | Panduan memulai |
|---|---|---|---|
| Grok 4.3 (Pratinjau) | Bahasa | Model berperforma tinggi dari xAI. | Kartu model |
| Grok 4.20 (Penalaran) (Pratinjau) | Bahasa | Grok 4.20 (Penalaran) adalah model berperforma tinggi dari xAI, yang memiliki tingkat halusinasi rendah yang terdepan di industri. Unggul dalam tugas pemahaman dokumen dan panggilan alat agentic cakrawala panjang. | Kartu model |
| Grok 4.20 (Non-penalaran) (Pratinjau) | Bahasa | Grok 4.20 (Non-Penalaran) adalah model non-pemikiran berperforma tinggi dari xAI, yang memiliki tingkat halusinasi rendah yang terdepan di industri. Unggul dalam kasus penggunaan yang sensitif terhadap latensi seperti dukungan dan kategorisasi pelanggan. | Kartu model |
| Grok 4.1 Cepat (Penalaran) (Pratinjau) | Bahasa | Grok 4.1 Cepat (Penalaran) adalah model xAI yang paling hemat biaya, yang memiliki kemampuan panggilan alat yang kuat dan sintesis basis pengetahuan yang efisien. Unggul dalam tugas penelusuran yang melibatkan data web dan alat basis pengetahuan internal. | Kartu model |
| Grok 4.1 Cepat (Non-penalaran) (Pratinjau) | Bahasa | Grok 4.1 Cepat (Non-Penalaran) adalah model non-pemikiran xAI yang paling hemat biaya, yang dioptimalkan untuk performa latensi rendah. Unggul dalam tugas bervolume tinggi seperti perangkuman dan kategorisasi. | Kartu model |
| Claude Opus 4.8 | Bahasa, Visi | Claude Opus 4.8 adalah model Opus berintelijen tinggi yang dibuat untuk coding dan agen, dengan penalaran yang lebih mendalam untuk alur kerja perusahaan. | Kartu model |
| Claude Opus 4.7 | Bahasa, Visi | Claude Opus 4.7 adalah model berintelijen tinggi dari Anthropic dan pemimpin industri di seluruh coding, agen, penggunaan komputer, dan alur kerja perusahaan. | Kartu model |
| Claude Sonnet 4.6 | Bahasa, Visi | Claude Sonnet 4.6 menghadirkan kecerdasan terdepan dalam skala besar—dibuat untuk coding, agen, dan alur kerja perusahaan. | Kartu model |
| Claude Opus 4.6 | Bahasa, Visi | Claude Opus 4.6 adalah model berintelijen tinggi dari Anthropic dan pemimpin industri di seluruh coding, agen, penggunaan komputer, dan alur kerja perusahaan. | Kartu model |
| Claude Opus 4.5 | Bahasa, Visi | Claude Opus 4.5 adalah model berintelijen tinggi dari Anthropic dan pemimpin industri di seluruh coding, agen, penggunaan komputer, dan alur kerja perusahaan. | Kartu model |
| Claude Sonnet 4.5 | Bahasa, Visi | Model berukuran sedang dari Anthropic untuk mendukung agen dunia nyata, dengan kemampuan dalam coding, penggunaan komputer, keamanan siber, dan bekerja dengan file kantor seperti spreadsheet. | Kartu model |
| Claude Opus 4.1 | Bahasa, Visi | Pemimpin industri untuk coding. Model ini memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga memperluas kemampuan agen AI secara signifikan. Ideal untuk mendukung produk dan fitur agen terdepan. | Kartu model |
| Claude Haiku 4.5 | Bahasa, Visi | Claude Haiku 4.5 memberikan performa mendekati terdepan untuk berbagai kasus penggunaan, dan menonjol sebagai salah satu model coding terbaik di dunia–dengan kecepatan dan biaya yang tepat untuk mendukung produk gratis dan pengalaman pengguna bervolume tinggi. | Kartu model |
| Claude Opus 4 | Bahasa, Visi | Claude Opus 4 memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga memperluas kemampuan agen AI secara signifikan. | Kartu model |
| Claude Sonnet 4 | Bahasa, Visi | Model berukuran sedang dari Anthropic dengan kecerdasan unggul untuk penggunaan bervolume tinggi, seperti coding, riset mendalam, dan agen. | Kartu model |
| Claude 3.5 Sonnet v2 dari Anthropic | Bahasa, Visi | Claude 3.5 Sonnet adalah model berperforma tinggi untuk tugas software engineering dunia nyata dan kemampuan agentic. Claude 3.5 Sonnet menghadirkan peningkatan ini dengan harga dan kecepatan yang sama seperti pendahulunya. | Kartu model |
| Claude 3.5 Sonnet dari Anthropic | Bahasa | Claude 3.5 Sonnet mengungguli Claude 3 Opus dari Anthropic di berbagai evaluasi Anthropic dengan kecepatan dan biaya layaknya model tingkat menengah Anthropic, yaitu Claude 3 Sonnet. | Kartu model |
| Jamba 1.5 Besar (Pratinjau) | Bahasa | Jamba 1.5 Besar dari AI21 Labs dirancang untuk respons berkualitas unggul, throughput tinggi, dan harga yang kompetitif dibandingkan dengan model lain dalam kelas ukurannya. | Kartu model |
| Jamba 1.5 Mini (Pratinjau) | Bahasa | Jamba 1.5 Mini dari AI21 Labs memiliki keseimbangan yang baik dalam hal kualitas, throughput, dan biaya rendah. | Kartu model |
| Mistral Medium 3 | Bahasa | Mistral Medium 3 adalah model serbaguna yang dirancang untuk berbagai tugas, termasuk pemrograman, penalaran matematika, pemahaman dokumen panjang, perangkuman, dan dialog. | Kartu model |
| Mistral OCR (25.05) | Bahasa, Visi | Mistral OCR (25.05) adalah Optical Character Recognition API untuk pemahaman dokumen. Model ini memahami setiap elemen dokumen seperti media, teks, tabel, dan persamaan. | Kartu model |
| Mistral Small 3.1 (25.03) | Bahasa | Mistral Small 3.1 (25.03) adalah versi model Small dari Mistral, yang memiliki kemampuan multimodal dan panjang konteks yang diperluas. | Kartu model |
| Codestral 2 | Bahasa, Kode | Codestral 2 adalah model khusus pembuatan kode dari Mistral yang dibuat khusus untuk penyelesaian isi-di-tengah (FIM) dengan presisi tinggi yang membantu developer menulis dan berinteraksi dengan kode melalui endpoint API penyelesaian dan instruksi bersama. | Kartu model |
Mengevaluasi model partner menggunakan Layanan evaluasi AI generatif
Layanan evaluasi AI generatif mendukung evaluasi model partner, seperti model Anthropic dan Llama. Evaluasi model partner didukung melalui Model Garden, sehingga Anda harus mengaktifkan model sebelum menjalankan evaluasi terhadap model partner.
Untuk mengetahui informasi selengkapnya, lihat Melakukan evaluasi menggunakan konsol.
Harga model partner Platform Agen Gemini Enterprise dengan jaminan kapasitas
Google menawarkan throughput yang disediakan untuk beberapa model partner yang mencadangkan kapasitas throughput untuk model Anda dengan biaya tetap. Anda menentukan kapasitas throughput dan region tempat kapasitas tersebut akan dicadangkan. Karena permintaan throughput yang disediakan diprioritaskan daripada permintaan standar bayar sesuai penggunaan, throughput yang disediakan memberikan peningkatan ketersediaan. Saat sistem kelebihan beban, permintaan Anda masih dapat diselesaikan selama throughput tetap berada di bawah kapasitas throughput yang dicadangkan. Untuk mengetahui informasi selengkapnya atau berlangganan layanan ini, hubungi bagian penjualan.
Endpoint regional, global, dan multi-region
Untuk endpoint regional, permintaan akan ditayangkan dari region yang Anda tentukan. Jika Anda memiliki persyaratan residensi data atau jika model tidak mendukung endpoint global, gunakan endpoint regional.
Saat Anda menggunakan endpoint global, Google dapat memproses dan menayangkan permintaan Anda dari region mana pun yang didukung oleh model yang Anda gunakan, yang mungkin menyebabkan latensi yang lebih tinggi dalam beberapa kasus. Endpoint global membantu meningkatkan ketersediaan secara keseluruhan dan membantu mengurangi error.
Endpoint multi-region memungkinkan akses ketersediaan tinggi ke model partner sekaligus mempertahankan residensi data dalam geografi yang lebih luas, seperti Amerika Serikat.
Ada perbedaan harga bergantung pada jenis endpoint yang Anda pilih. Untuk mengetahui informasi selengkapnya tentang kuota dan kemampuan, lihat halaman model pihak ketiga terkait.
Endpoint Global
Untuk menggunakan endpoint global, tetapkan region ke global.
Misalnya, URL permintaan untuk perintah curl menggunakan format berikut:
https://aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/global/publishers/PUBLISHER_NAME/models/MODEL_NAME
Untuk Agent Platform SDK, endpoint regional adalah default. Tetapkan region ke GLOBAL untuk menggunakan endpoint global.
Model yang didukung untuk endpoint global
Endpoint global tersedia untuk model berikut:
- Claude Opus 4.8
- Claude Opus 4.7
- Claude Opus 4.6
- Claude Sonnet 4.6
- Claude Opus 4.5
- Claude Opus 4.1
- Claude Opus 4
- Claude Sonnet 4.5
- Claude Sonnet 4
- Claude 3.7 Sonnet
- Claude 3.5 Sonnet v2
- Claude Haiku 4.5
- Grok 4.1 Cepat
- Grok 4.20
- Grok 4.3
Membatasi penggunaan endpoint API global
Untuk membantu menerapkan penggunaan endpoint regional, gunakan batasan kebijakan organisasi constraints/gcp.restrictEndpointUsage untuk memblokir permintaan ke endpoint API global. Untuk mengetahui informasi selengkapnya, lihat
Membatasi penggunaan endpoint.
Endpoint multi-region
Endpoint multi-region memungkinkan akses ketersediaan tinggi ke model partner sekaligus mempertahankan residensi data dalam geografi yang lebih luas, seperti Amerika Serikat atau Uni Eropa.
Pilih tab yang sesuai untuk multi-region yang ingin Anda gunakan:
US
Untuk menggunakan endpoint multi-region US, tetapkan URL endpoint ke aiplatform.us.rep.googleapis.com.
URL permintaan untuk perintah curl menggunakan format berikut:
https://aiplatform.us.rep.googleapis.com/v1/projects/PROJECT_ID/locations/us/publishers/anthropic/models/MODEL_NAME
Uni Eropa
Untuk menggunakan endpoint multi-region Uni Eropa, tetapkan URL endpoint ke aiplatform.eu.rep.googleapis.com.
URL permintaan untuk perintah curl menggunakan format berikut:
https://aiplatform.eu.rep.googleapis.com/v1/projects/PROJECT_ID/locations/eu/publishers/anthropic/models/MODEL_NAME
Untuk mengetahui informasi selengkapnya tentang format MODEL_NAME, lihat dokumentasi Anthropic.
Model yang didukung untuk endpoint multi-region:
Model berikut didukung. Gunakan ID Model lengkap termasuk tanggal versi jika berlaku.
| Model | ID model API |
|---|---|
claude-opus-4-8 |
claude-opus-4-8 |
claude-opus-4-7 |
claude-opus-4-7 |
Contoh Permintaan:
Berikut cara memanggil endpoint multi-region menggunakan curl:
export PROJECT_ID="YOUR_PROJECT_ID"
# Example using claude-opus-4-7
# Option 1: US Region
export LOCATION="us"
export ENDPOINT="aiplatform.us.rep.googleapis.com"
# Option 2: EU Region
# export LOCATION="eu"
# export ENDPOINT="aiplatform.eu.rep.googleapis.com"
export MODEL_ID="claude-opus-4-7"
curl -X POST \
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
-H "Content-Type: application/json" \
"https://${ENDPOINT}/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:rawPredict" \
-d '{
"max_tokens": 300,
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "Why is the sky blue?"
}
]
}
],
"anthropic_version": "vertex-2023-10-16"
}'
Kuota multi-region:
Kuota multi-region khusus diterapkan. Anda dapat melihat dan meminta peningkatan untuk nilai kuota default ini di Google Cloud konsol.
Contoh Kuota US:
UsOnlinePredictionInputTokensPerMinutePerBaseModelUsOnlinePredictionOutputTokensPerMinutePerBaseModelUsOnlinePredictionRequestsPerMinPerProjectPerBaseModelUsOnlinePredictionWebSearchRequestsPerProjectPerPublisher
Contoh Kuota Uni Eropa:
EuOnlinePredictionInputTokensPerMinutePerBaseModelEuOnlinePredictionOutputTokensPerMinutePerBaseModelEuOnlinePredictionRequestsPerMinPerProjectPerBaseModelEuOnlinePredictionWebSearchRequestsPerProjectPerPublisher
Memberikan akses pengguna ke model partner
Agar Anda dapat mengaktifkan model partner dan membuat permintaan prompt, a Google Cloud administrator harus menetapkan izin yang diperlukan dan memverifikasi bahwa kebijakan organisasi mengizinkan penggunaan API yang diperlukan.
Menetapkan izin yang diperlukan untuk menggunakan model partner
Peran dan izin berikut diperlukan untuk menggunakan model partner:
Anda harus memiliki peran Pengelolaan Akses dan Identitas (IAM) Consumer Procurement Entitlement Manager. Siapa pun yang telah diberi peran ini dapat mengaktifkan model partner di Model Garden.
Anda harus memiliki izin
aiplatform.endpoints.predict. Izin ini disertakan dalam peran IAM Pengguna Platform Agen. Untuk mengetahui informasi selengkapnya, lihat Pengguna Platform Agen Gemini Enterprise dan Kontrol akses.
Konsol
Untuk memberikan peran IAM Consumer Procurement Entitlement Manager kepada pengguna, buka halaman IAM.
Di panel Edit access, klik Add another role.
Di Select a role, pilih Consumer Procurement Entitlement Manager.
Di panel akses edit, klik Tambahkan peran lain.
Di Select a role, pilih Agent Platform User.
Klik Save.
gcloud
-
Di konsol, aktifkan Cloud Shell. Google Cloud
Berikan peran Consumer Procurement Entitlement Manager yang diperlukan untuk mengaktifkan model partner di Model Garden
gcloud projects add-iam-policy-binding PROJECT_ID \ --member=PRINCIPAL --role=roles/consumerprocurement.entitlementManagerBerikan peran Pengguna Platform Agen yang mencakup izin
aiplatform.endpoints.predictyang diperlukan untuk membuat permintaan prompt:gcloud projects add-iam-policy-binding PROJECT_ID \ --member=PRINCIPAL --role=roles/aiplatform.userGanti
PRINCIPALdengan ID untuk principal. ID menggunakan formatuser|group|serviceAccount:emailataudomain:domain—misalnya,user:cloudysanfrancisco@gmail.com,group:admins@example.com,serviceAccount:test123@example.domain.com, ataudomain:example.domain.com.Outputnya adalah daftar binding kebijakan yang mencakup hal berikut:
- members: - user:PRINCIPAL role: roles/roles/consumerprocurement.entitlementManagerUntuk mengetahui informasi selengkapnya, lihat Memberikan satu peran dan
gcloud projects add-iam-policy-binding.
Menetapkan kebijakan organisasi untuk akses model partner
Untuk mengaktifkan model partner, kebijakan organisasi Anda harus mengizinkan API berikut: Cloud Commerce Consumer Procurement API - cloudcommerceconsumerprocurement.googleapis.com
Jika organisasi Anda menetapkan kebijakan organisasi untuk
membatasi penggunaan layanan,
administrator organisasi harus memverifikasi bahwa
cloudcommerceconsumerprocurement.googleapis.com diizinkan dengan
menetapkan kebijakan organisasi.
Selain itu, jika Anda memiliki kebijakan organisasi yang membatasi penggunaan model di Model Garden, kebijakan tersebut harus mengizinkan akses ke model partner. Untuk mengetahui informasi selengkapnya, lihat Mengontrol akses model.
Kepatuhan terhadap peraturan model partner
Sertifikasi untuk AI Generatif di Platform Agen Gemini Enterprise akan terus berlaku saat model partner digunakan sebagai API terkelola menggunakan Platform Agen Gemini Enterprise. Jika Anda memerlukan detail tentang model itu sendiri, informasi tambahan dapat ditemukan di Kartu Model masing-masing, atau Anda dapat menghubungi penayang model terkait.
Data Anda disimpan dalam penyimpanan di dalam region atau multi-region yang dipilih untuk model partner di Platform Agen Gemini Enterprise, tetapi regionalisasi pemrosesan data dapat bervariasi. Untuk mengetahui daftar lengkap komitmen pemrosesan data model partner, lihat Residen data untuk model partner.
Prompt pelanggan dan respons model tidak dibagikan kepada pihak ketiga saat menggunakan Gemini Enterprise API, termasuk model partner. Google hanya memproses Data Pelanggan sesuai petunjuk Pelanggan, yang dijelaskan lebih lanjut dalam Adendum Pemrosesan Data Cloud kami.