Deployment dan endpoint

Model Google dan Partner serta fitur AI generatif di Vertex AI ditampilkan sebagai endpoint regional tertentu dan endpoint global. Endpoint global mencakup seluruh dunia dan memberikan ketersediaan dan keandalan yang lebih tinggi daripada region tunggal.

Endpoint global

Memilih endpoint global untuk permintaan Anda dapat meningkatkan ketersediaan secara keseluruhan sekaligus mengurangi error resource habis (429). Jangan gunakan endpoint global jika Anda memiliki persyaratan pemrosesan ML, karena Anda tidak dapat mengontrol atau mengetahui region tempat permintaan pemrosesan ML Anda dikirim saat permintaan dibuat.

Model yang didukung

Penggunaan endpoint global didukung untuk model Google berikut di wilayah tertentu. Untuk mengetahui detail tentang region yang mendukung endpoint global, lihat tab Global di tabel lokasi endpoint model Google.

Untuk mengetahui informasi tentang ketersediaan endpoint global untuk model partner, lihat tab Global di Google Cloud tabel lokasi endpoint model partner.

Menggunakan endpoint global

Untuk menggunakan endpoint global, kecualikan lokasi dari nama endpoint dan konfigurasi lokasi resource ke global. Misalnya, berikut adalah URL endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Untuk Google Gen AI SDK, buat klien yang menggunakan lokasi global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Untuk Vertex AI SDK untuk Python, lakukan inisialisasi SDK menggunakan lokasi global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Batasan

Kemampuan berikut tidak tersedia saat menggunakan endpoint global:

  • Penyesuaian
  • Prediksi batch untuk model Anthropic dan OpenMaaS
  • Korpus retrieval-augmented generation (RAG) (permintaan RAG didukung)

Penggunaan endpoint global dengan Throughput yang Disediakan hanya tersedia untuk model berikut:

Klik untuk melihat model yang didukung untuk endpoint global saat menggunakan Throughput yang Disediakan

Model Versi model terbaru yang didukung
Gemini 3 Flash pratinjau gemini-3-flash-preview
Gemini 3 Pro pratinjau gemini-3-pro-preview
Gambar Gemini 3 Pro pratinjau gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash pratinjau gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite pratinjau gemini-2.5-flash-lite-preview-09-2025
Gambar Gemini 2.5 Flash gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Lokasi endpoint model Google

Model Google di Vertex AI tersedia untuk endpoint berikut:

Global

Global(global)
Model Gemini
Gemini 3 Flash pratinjau (gemini-3-flash-preview)
Gemini 3 Pro pratinjau (gemini-3-pro-preview)
Gambar Gemini 3 Pro pratinjau (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pratinjau (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pratinjau (gemini-2.5-flash-lite-preview-09-2025)
Gambar Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API pratinjau (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash dengan Gemini Live API Pratinjau (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Model embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings for Text
Embedding untuk Multimodal
Model Imagen di Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Penyesuaian Terkontrol Imagen 3 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Pembuatan Imagen 4 Ultra (imagen-4.0-ultra-generate-001)
Model Veo di Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-exp)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-fast-generate-preview)
Pembuatan Veo 3 (veo-3.0-generate-001)
Pembuatan Cepat Veo 3 (veo-3.0-fast-generate-001)
Veo 3.1 Buat pratinjau (veo-3.1-generate-preview)
Veo 3.1 Fast Generate pratinjau (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Model Speech-to-Text dan Text-to-Speech
Chirp 3: Transkripsi (chirp_3)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS pratinjau (gemini-2.5-flash-lite-preview-tts)

Amerika Serikat

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) South Carolina(us-east1) Virginia Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Model Gemini
Gemini 3 Flash pratinjau (gemini-3-flash-preview)
Gemini 3 Pro pratinjau (gemini-3-pro-preview)
Gambar Gemini 3 Pro pratinjau (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pratinjau (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pratinjau (gemini-2.5-flash-lite-preview-09-2025)
Gambar Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API pratinjau (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash dengan Gemini Live API Pratinjau (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Model embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings for Text
Embedding untuk Multimodal
Model Imagen di Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Penyesuaian Terkontrol Imagen 3 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Pembuatan Imagen 4 Ultra (imagen-4.0-ultra-generate-001)
Model Veo di Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-exp)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-fast-generate-preview)
Pembuatan Veo 3 (veo-3.0-generate-001)
Pembuatan Cepat Veo 3 (veo-3.0-fast-generate-001)
Veo 3.1 Buat pratinjau (veo-3.1-generate-preview)
Veo 3.1 Fast Generate pratinjau (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Model Speech-to-Text dan Text-to-Speech
Chirp 3: Transkripsi (chirp_3)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS pratinjau (gemini-2.5-flash-lite-preview-tts)

Amerika

Montréal(northamerica-northeast1) São Paulo(southamerica-east1)
Model Gemini
Gemini 3 Flash pratinjau (gemini-3-flash-preview)
Gemini 3 Pro pratinjau (gemini-3-pro-preview)
Gambar Gemini 3 Pro pratinjau (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pratinjau (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pratinjau (gemini-2.5-flash-lite-preview-09-2025)
Gambar Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API pratinjau (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash dengan Gemini Live API Pratinjau (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Model embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings for Text
Embedding untuk Multimodal
Model Imagen di Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Penyesuaian Terkontrol Imagen 3 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Pembuatan Imagen 4 Ultra (imagen-4.0-ultra-generate-001)
Model Veo di Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-exp)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-fast-generate-preview)
Pembuatan Veo 3 (veo-3.0-generate-001)
Pembuatan Cepat Veo 3 (veo-3.0-fast-generate-001)
Veo 3.1 Buat pratinjau (veo-3.1-generate-preview)
Veo 3.1 Fast Generate pratinjau (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Model Speech-to-Text dan Text-to-Speech
Chirp 3: Transkripsi (chirp_3)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS pratinjau (gemini-2.5-flash-lite-preview-tts)

Eropa

London(europe-west2) Belgia(europe-west1) Belanda(europe-west4) Zürich(europe-west6) Frankfurt(europe-west3) Finlandia(europe-north1) Warsawa(europe-central2) Milan(europe-west8) Madrid(europe-southwest1) Paris(europe-west9)
Model Gemini
Gemini 3 Flash pratinjau (gemini-3-flash-preview)
Gemini 3 Pro pratinjau (gemini-3-pro-preview)
Gambar Gemini 3 Pro pratinjau (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pratinjau (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pratinjau (gemini-2.5-flash-lite-preview-09-2025)
Gambar Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API pratinjau (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash dengan Gemini Live API Pratinjau (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Model embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings for Text
Embedding untuk Multimodal
Model Imagen di Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Penyesuaian Terkontrol Imagen 3 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Pembuatan Imagen 4 Ultra (imagen-4.0-ultra-generate-001)
Model Veo di Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-exp)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-fast-generate-preview)
Pembuatan Veo 3 (veo-3.0-generate-001)
Pembuatan Cepat Veo 3 (veo-3.0-fast-generate-001)
Veo 3.1 Buat pratinjau (veo-3.1-generate-preview)
Veo 3.1 Fast Generate pratinjau (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Model Speech-to-Text dan Text-to-Speech
Chirp 3: Transkripsi (chirp_3)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS pratinjau (gemini-2.5-flash-lite-preview-tts)

Asia Pasifik

Mumbai(asia-south1) Singapura(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seoul(asia-northeast3)
Model Gemini
Gemini 3 Flash pratinjau (gemini-3-flash-preview)
Gemini 3 Pro pratinjau (gemini-3-pro-preview)
Gambar Gemini 3 Pro pratinjau (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pratinjau (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pratinjau (gemini-2.5-flash-lite-preview-09-2025)
Gambar Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API pratinjau (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash dengan Gemini Live API Pratinjau (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Model embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings for Text
Embedding untuk Multimodal
Model Imagen di Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Penyesuaian Terkontrol Imagen 3 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Pembuatan Imagen 4 Ultra (imagen-4.0-ultra-generate-001)
Model Veo di Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-exp)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-fast-generate-preview)
Pembuatan Veo 3 (veo-3.0-generate-001)
Pembuatan Cepat Veo 3 (veo-3.0-fast-generate-001)
Veo 3.1 Buat pratinjau (veo-3.1-generate-preview)
Veo 3.1 Fast Generate pratinjau (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Model Speech-to-Text dan Text-to-Speech
Chirp 3: Transkripsi (chirp_3)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS pratinjau (gemini-2.5-flash-lite-preview-tts)

Timur Tengah

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Model Gemini
Gemini 3 Flash pratinjau (gemini-3-flash-preview)
Gemini 3 Pro pratinjau (gemini-3-pro-preview)
Gambar Gemini 3 Pro pratinjau (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pratinjau (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pratinjau (gemini-2.5-flash-lite-preview-09-2025)
Gambar Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash dengan audio bawaan Gemini Live API pratinjau (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash dengan Gemini Live API Pratinjau (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Model embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings for Text
Embedding untuk Multimodal
Model Imagen di Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Penyesuaian Terkontrol Imagen 3 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Pembuatan Imagen 4 Ultra (imagen-4.0-ultra-generate-001)
Model Veo di Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-exp)
Pembuatan Veo 2 pratinjau (veo-2.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-generate-preview)
Veo 3 Generate pratinjau (veo-3.0-fast-generate-preview)
Pembuatan Veo 3 (veo-3.0-generate-001)
Pembuatan Cepat Veo 3 (veo-3.0-fast-generate-001)
Veo 3.1 Buat pratinjau (veo-3.1-generate-preview)
Veo 3.1 Fast Generate pratinjau (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Model Speech-to-Text dan Text-to-Speech
Chirp 3: Transkripsi (chirp_3)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS pratinjau (gemini-2.5-flash-lite-preview-tts)

Lokasi endpoint model partnerGoogle Cloud

Google menayangkan permintaan dari region yang Anda tentukan. Untuk beberapa model, Google juga menawarkan endpoint global untuk meningkatkan ketersediaan secara keseluruhan dan mengurangi rasio error. Endpoint global dapat memiliki serangkaian kuota yang terpisah dari endpoint regional dan tidak mendukung persyaratan residensi data. Untuk mengetahui informasi selengkapnya, lihat bagian "Endpoint regional dan global" di Model partner Vertex AI untuk MaaS.

Endpoint model partner untuk AI Generatif di Vertex AI tersedia di wilayah berikut:

Global

Global(global)
Model Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Model Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Amerika Serikat

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) South Carolina(us-east1) Virginia Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Model Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Model Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Amerika

Montréal(northamerica-northeast1) São Paulo(southamerica-east1)
Model Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Model Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Eropa

London(europe-west2) Belgia(europe-west1) Belanda(europe-west4) Zürich(europe-west6) Frankfurt(europe-west3) Finlandia(europe-north1) Warsawa(europe-central2) Milan(europe-west8) Madrid(europe-southwest1) Paris(europe-west9)
Model Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Model Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asia Pasifik

Mumbai(asia-south1) Singapura(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seoul(asia-northeast3)
Model Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Model Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Timur Tengah

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Model Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Model Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Lokasi endpoint model terbukaGoogle Cloud

Google menayangkan permintaan dari region yang Anda tentukan. Untuk beberapa model, Google juga menawarkan endpoint global untuk meningkatkan ketersediaan secara keseluruhan dan mengurangi rasio error. Endpoint global dapat memiliki serangkaian kuota yang terpisah dari endpoint regional dan tidak mendukung persyaratan residensi data. Untuk mengetahui informasi selengkapnya, lihat bagian "Endpoint regional dan global" di Model terbuka Vertex AI untuk MaaS.

Endpoint model terbuka untuk AI Generatif di Vertex AI tersedia di wilayah berikut:

Global

Global(global)
Model Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Model ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Model OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Model AI Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Model Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Model MiniMax
MiniMax M2 (minimax-m2-maas)
Model Qwen
Qwen3-Next-80B Berpikir (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Model e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Amerika Serikat

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) South Carolina(us-east1) Virginia Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Model Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Model ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Model OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Model AI Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Model Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Model MiniMax
MiniMax M2 (minimax-m2-maas)
Model Qwen
Qwen3-Next-80B Berpikir (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Model e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Amerika

Montréal(northamerica-northeast1) São Paulo(southamerica-east1)
Model Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Model ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Model OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Model AI Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Model Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Model MiniMax
MiniMax M2 (minimax-m2-maas)
Model Qwen
Qwen3-Next-80B Berpikir (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Model e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Eropa

London(europe-west2) Belgia(europe-west1) Belanda(europe-west4) Zürich(europe-west6) Frankfurt(europe-west3) Finlandia(europe-north1) Warsawa(europe-central2) Milan(europe-west8) Madrid(europe-southwest1) Paris(europe-west9)
Model Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Model ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Model OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Model AI Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Model Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Model MiniMax
MiniMax M2 (minimax-m2-maas)
Model Qwen
Qwen3-Next-80B Berpikir (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Model e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Asia Pasifik

Mumbai(asia-south1) Singapura(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seoul(asia-northeast3)
Model Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Model ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Model OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Model AI Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Model Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Model MiniMax
MiniMax M2 (minimax-m2-maas)
Model Qwen
Qwen3-Next-80B Berpikir (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Model e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Timur Tengah

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Model Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Model ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Model OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Model AI Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Model Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Model MiniMax
MiniMax M2 (minimax-m2-maas)
Model Qwen
Qwen3-Next-80B Berpikir (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Model e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Langkah berikutnya