Deployment dan endpoint

Model Google dan Partner serta fitur AI generatif di Vertex AI ditampilkan sebagai endpoint regional tertentu dan endpoint global. Endpoint global mencakup seluruh dunia dan memberikan ketersediaan dan keandalan yang lebih tinggi daripada region tunggal.

Perhatikan bahwa endpoint model tidak menjamin ketersediaan wilayah atau pemrosesan ML dalam wilayah. Untuk mengetahui informasi tentang residensi data, lihat Residensi data.

Endpoint global

Memilih endpoint global untuk permintaan Anda dapat meningkatkan ketersediaan secara keseluruhan sekaligus mengurangi error resource habis (429). Jangan gunakan endpoint global jika Anda memiliki persyaratan pemrosesan ML, karena Anda tidak dapat mengontrol atau mengetahui region tempat permintaan pemrosesan ML Anda dikirim saat permintaan dibuat.

Model yang didukung

Penggunaan endpoint global didukung untuk model Google berikut di wilayah tertentu. Untuk mengetahui detail tentang region yang mendukung endpoint global, lihat tab Global di tabel lokasi endpoint model Google.

Untuk mengetahui informasi tentang ketersediaan endpoint global untuk model partner, lihat tab Global di Google Cloud tabel lokasi endpoint model partner.

Menggunakan endpoint global

Untuk menggunakan endpoint global, kecualikan lokasi dari nama endpoint dan konfigurasi lokasi resource ke global. Misalnya, berikut adalah URL endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Untuk Google Gen AI SDK, buat klien yang menggunakan lokasi global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Untuk Vertex AI SDK untuk Python, lakukan inisialisasi SDK menggunakan lokasi global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Batasan

Kemampuan berikut tidak tersedia saat menggunakan endpoint global:

  • Penyesuaian
  • Prediksi batch
  • Korpus retrieval-augmented generation (RAG) (permintaan RAG didukung)

Penggunaan endpoint global dengan Throughput yang Disediakan hanya tersedia untuk model berikut:

Model Versi model terbaru yang didukung
Gemini 2.5 Flash (pratinjau) gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite (pratinjau) gemini-2.5-flash-lite-preview-09-2025
Gambar Gemini 2.5 Flash gemini-2.5-flash-image
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Lokasi endpoint model Google

Endpoint model Google untuk AI Generatif di Vertex AI tersedia di wilayah berikut.

Amerika Serikat

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina Selatan (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio)
Gambar Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (Pratinjau)
(veo-3.0-generate-preview)
Veo 3 Fast (Pratinjau)
(veo-3.0-fast-generate-preview)
Chirp 3: Transkripsi (chirp_3)
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan

Kanada

Montréal (northamerica-northeast1)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio)
Gambar Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkripsi (chirp_3)
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan

Amerika Selatan

São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio)
Gambar Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkripsi (chirp_3)
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan

Eropa

Belanda (europe-west4) Paris, Prancis (europe-west9) London, Inggris Raya (europe-west2) Frankfurt, Jerman (europe-west3) Belgia (europe-west1) Zürich, Swiss (europe-west6) Madrid, Spanyol (europe-southwest1) Milan, Italia (europe-west8) Finlandia (europe-north1) Warsaw, Polandia (europe-central2)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio)
Gambar Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkripsi (chirp_3)
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan

Asia Pasifik

Tokyo, Jepang (asia-northeast1) Sydney, Australia (australia-southeast1) Singapura (asia-southeast1) Seoul, Korea (asia-northeast3) Taiwan (asia-east1) Hong Kong, China (asia-east2) Mumbai, India (asia-south1)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio)
Gambar Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
*
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkripsi (chirp_3)
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan

Timur Tengah

Dammam, Arab Saudi (me-central2) Doha, Qatar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio)
Gambar Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkripsi (chirp_3)
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan

Global

Global (global)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash dengan audio bawaan Live API
(gemini-live-2.5-flash-preview-native-audio)
Gambar Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embedding Gemini
(gemini-embedding-001)
Embeddings for Text
Embedding untuk Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Pengeditan dan Penyesuaian Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate eksperimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkripsi (chirp_3)
Chirp 2: Transkripsi (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: Suara HD
Chirp 3: Suara Kustom Instan

* Region hanya tersedia saat menggunakan Throughput yang Disediakan Zona Tunggal atau prediksi batch, dan penyesuaian terawasi tidak didukung di region ini.

Lokasi endpoint model partnerGoogle Cloud

Google melayani permintaan dari region yang Anda tentukan. Untuk beberapa model, Google juga menawarkan endpoint global untuk meningkatkan ketersediaan secara keseluruhan dan mengurangi rasio error. Endpoint global dapat memiliki serangkaian kuota yang terpisah dari endpoint regional dan tidak mendukung persyaratan residensi data. Untuk mengetahui informasi selengkapnya, lihat bagian "Endpoint regional dan global" di Model partner Vertex AI untuk MaaS.

Endpoint model partner untuk AI Generatif di Vertex AI tersedia di wilayah berikut:

Amerika Serikat

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina Selatan (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Claude Sonnet 4.5 dari Anthropic
Claude Opus 4.1 dari Anthropic
Claude Haiku 4.5 dari Anthropic
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Eropa

Belanda (europe-west4) Belgia (europe-west1)
Claude Sonnet 4.5 dari Anthropic
Claude Opus 4.1 dari Anthropic
Claude Haiku 4.5
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asia Pasifik

Singapura (asia-southeast1) Taiwan (asia-east1)
Claude Sonnet 4.5 dari Anthropic
Claude Opus 4.1 dari Anthropic
Claude Haiku 4.5 dari Anthropic
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

Global (global)
Claude Sonnet 4.5 dari Anthropic
Claude Opus 4.1 dari Anthropic
Claude Haiku 4.5 dari Anthropic
Claude Opus 4 dari Anthropic
Claude Sonnet 4 dari Anthropic
Claude 3.7 Sonnet dari Anthropic
Claude 3.5 Haiku dari Anthropic
Claude 3 Haiku dari Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Lokasi endpoint model terbukaGoogle Cloud

Google melayani permintaan dari region yang Anda tentukan. Untuk beberapa model, Google juga menawarkan endpoint global untuk meningkatkan ketersediaan secara keseluruhan dan mengurangi rasio error. Endpoint global dapat memiliki serangkaian kuota yang terpisah dari endpoint regional dan tidak mendukung persyaratan residensi data. Untuk mengetahui informasi selengkapnya, lihat bagian "Endpoint regional dan global" di Model terbuka Vertex AI untuk MaaS.

Endpoint model terbuka untuk AI Generatif di Vertex AI tersedia di wilayah berikut:

Amerika Serikat

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina Selatan (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Multilingual E5 Small
Multilingual E5 Large

Eropa

Belanda (europe-west4) Belgia (europe-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)
Multilingual E5 Small
Multilingual E5 Large

Asia Pasifik

Singapura (asia-southeast1) Taiwan (asia-east1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)

Global

Global (global)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Pratinjau)
Llama 4 Scout 17B-16E (Pratinjau)
Llama 3.3 70B (Pratinjau)
Llama 3.2 90B (Pratinjau)
Llama 3.1 405B
Llama 3.1 70B (Pratinjau)
Llama 3.1 8B (Pratinjau)

Langkah berikutnya