Bereitstellungen und Endpunkte

Google- und Partnermodelle sowie generative KI-Funktionen in Vertex AI werden als bestimmte regionale Endpunkte und ein globaler Endpunkt bereitgestellt. Globale Endpunkte decken die ganze Welt ab und bieten eine höhere Verfügbarkeit und Zuverlässigkeit als einzelne Regionen.

Globaler Endpunkt

Wenn Sie einen globalen Endpunkt für Ihre Anfragen auswählen, kann die Gesamtverfügbarkeit verbessert und die Anzahl der Fehler vom Typ „Ressource erschöpft“ (429) reduziert werden. Verwenden Sie den globalen Endpunkt nicht, wenn Sie Anforderungen an die Verarbeitung von ML-Daten haben, da Sie nicht steuern oder wissen können, an welche Region Ihre Anfragen zur Verarbeitung von ML-Daten gesendet werden, wenn eine Anfrage gestellt wird.

Unterstützte Modelle

Die Verwendung des globalen Endpunkts wird für die folgenden Google-Modelle in den angegebenen Regionen unterstützt. Details dazu, in welchen Regionen der globale Endpunkt unterstützt wird, finden Sie in der Tabelle mit den Standorten der Google-Modellendpunkte auf dem Tab Global.

Informationen zur globalen Endpunktverfügbarkeit für Partnermodelle finden Sie in der Google Cloud Tabelle mit Endpunktstandorten für Partnermodelle auf dem Tab Global.

Globalen Endpunkt verwenden

Wenn Sie den globalen Endpunkt verwenden möchten, schließen Sie den Standort aus dem Endpunktnamen aus und konfigurieren Sie den Standort der Ressource auf global. Beispiel für eine globale Endpunkt-URL:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Erstellen Sie für das Google Gen AI SDK einen Client, der den global-Standort verwendet:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Initialisieren Sie das Vertex AI SDK für Python mit dem Standort global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Beschränkungen

Die folgenden Funktionen sind bei Verwendung des globalen Endpunkts nicht verfügbar:

Abstimmung
Batchvorhersage für Anthropic- und OpenMaaS-Modelle
RAG-Korpus (RAG-Anfragen werden unterstützt)

Die Verwendung des globalen Endpunkts mit bereitgestelltem Durchsatz ist nur für die folgenden Modelle verfügbar:

Modell	Neueste unterstützte Modellversion
Gemini 3 Flash (Vorabversion)	`gemini-3-flash-preview`
Gemini 3 Pro (Vorabversion)	`gemini-3-pro-preview`
Gemini 3 Pro Image (Vorabversion)	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash (Vorschau)	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite (Vorschau)	`gemini-2.5-flash-lite-preview-09-2025`
Gemini 2.5 Flash Image	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Standorte von Google-Modellendpunkten

Google-Modellendpunkte für generative KI in Vertex AI sind in den folgenden Regionen verfügbar.

USA

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, South Carolina (us-east1)	Northern Virginia (us-east4)	Oregon (us-west1)
Gemini 3 Pro (`gemini-3-pro-preview`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3: Bearbeitung und Anpassung (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate (experimentell) (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (Vorabversion) (`veo-3.0-generate-preview`)
Veo 3 Fast (Vorabversion) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (Vorschau) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (Vorschau) (`veo-3.1-fast-generate-preview`)
Chirp 3: Transkription (`chirp_3`)
Chirp 2: Transkription (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Kanada

	Montreal (northamerica-northeast1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3: Bearbeitung und Anpassung (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate (experimentell) (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transkription (`chirp_3`)
Chirp 2: Transkription (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Brasilien

	São Paulo (southamerica-east1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3: Bearbeitung und Anpassung (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate (experimentell) (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transkription (`chirp_3`)
Chirp 2: Transkription (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Europa

	Niederlande (europe-west4)	Paris, Frankreich (europe-west9)	London, Vereinigtes Königreich (europe-west2)	Frankfurt, Deutschland (europe-west3)	Belgien (europe-west1)	Zürich, Schweiz (europe-west6)	Madrid, Spanien (europe-southwest1)	Mailand, Italien (europe-west8)	Finnland (europe-north1)	Warschau, Polen (europe-central2)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3: Bearbeitung und Anpassung (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate (experimentell) (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transkription (`chirp_3`)
Chirp 2: Transkription (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Asiatisch-pazifischer Raum

	Tokio, Japan (asia-northeast1)	Sydney, Australien (australia-southeast1)	Singapur (asia-southeast1)	Seoul, Korea (asia-northeast3)	Taiwan (asia-east1)	Hongkong, China (asia-east2)	Mumbai, Indien (asia-south1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3: Bearbeitung und Anpassung (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate (experimentell) (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transkription (`chirp_3`)
Chirp 2: Transkription (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Naher Osten

	Dammam, Saudi-Arabien (me-central2)	Doha, Katar (me-central1)	Tel Aviv, Israel (me-west1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3: Bearbeitung und Anpassung (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate (experimentell) (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transkription (`chirp_3`)
Chirp 2: Transkription (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Global

	Global (global)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash`)
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3: Bearbeitung und Anpassung (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate (experimentell) (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transkription (`chirp_3`)
Chirp 2: Transkription (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Google Cloud Partnermodell-Endpunktstandorte

Google bearbeitet Anfragen aus der von Ihnen angegebenen Region. Für einige Modelle bietet Google auch einen globalen Endpunkt an, um die allgemeine Verfügbarkeit zu verbessern und die Fehlerraten zu senken. Der globale Endpunkt kann separate Kontingente für den regionalen Endpunkt haben und unterstützt keine Anforderungen an den Datenstandort. Weitere Informationen finden Sie im Abschnitt „Regionale und globale Endpunkte“ unter Vertex AI-Partnermodelle für MaaS.

Partnermodell-Endpunkte für Generative AI in Vertex AI sind in den folgenden Regionen verfügbar:

USA

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, South Carolina (us-east1)	Northern Virginia (us-east4)	Oregon (us-west1)
Claude Opus 4.5 von Anthropic
Claude Sonnet 4.5 von Anthropic
Claude Opus 4.1 von Anthropic
Claude Haiku 4.5 von Anthropic
Claude Opus 4 von Anthropic
Claude Sonnet 4 von Anthropic
Anthropic Claude 3.7 Sonnet (eingestellt)
Claude 3.5 Haiku von Anthropic (eingestellt)
Claude 3 Haiku von Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

	Niederlande (europe-west4)	Belgien (europe-west1)
Claude Opus 4.5 von Anthropic
Claude Sonnet 4.5 von Anthropic
Claude Opus 4.1 von Anthropic
Claude Haiku 4.5
Claude Opus 4 von Anthropic
Claude Sonnet 4 von Anthropic
Anthropic Claude 3.7 Sonnet (eingestellt)
Claude 3.5 Haiku von Anthropic (eingestellt)
Claude 3 Haiku von Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asiatisch-pazifischer Raum

	Singapur (asia-southeast1)	Taiwan (asia-east1)
Claude Opus 4.5 von Anthropic
Claude Sonnet 4.5 von Anthropic
Claude Opus 4.1 von Anthropic
Claude Haiku 4.5 von Anthropic
Claude Opus 4 von Anthropic
Claude Sonnet 4 von Anthropic
Anthropic Claude 3.7 Sonnet (eingestellt)
Claude 3.5 Haiku von Anthropic (eingestellt)
Claude 3 Haiku von Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

	Global (global)
Claude Opus 4.5 von Anthropic
Claude Sonnet 4.5 von Anthropic
Claude Opus 4.1 von Anthropic
Claude Haiku 4.5 von Anthropic
Claude Opus 4 von Anthropic
Claude Sonnet 4 von Anthropic
Anthropic Claude 3.7 Sonnet (eingestellt)
Claude 3.5 Haiku von Anthropic (eingestellt)
Claude 3 Haiku von Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud Standorte von Open Model-Endpunkten

Endpunkte für offene Modelle für generative KI in Vertex AI sind in den folgenden Regionen verfügbar:

USA

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, South Carolina (us-east1)	Northern Virginia (us-east4)	Oregon (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (Vorabversion)
Llama 3.1 70B (Vorabversion)
Llama 3.1 405B
Llama 3.2 90B (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
MiniMax M2
Mehrsprachig E5 Large
Mehrsprachig E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

	Niederlande (europe-west4)	Belgien (europe-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (Vorabversion)
Llama 3.1 70B (Vorabversion)
Llama 3.1 405B
Llama 3.2 90B (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
MiniMax M2
Mehrsprachig E5 Large
Mehrsprachig E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Asiatisch-pazifischer Raum

	Singapur (asia-southeast1)	Taiwan (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (Vorabversion)
Llama 3.1 70B (Vorabversion)
Llama 3.1 405B
Llama 3.2 90B (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
MiniMax M2
Mehrsprachig E5 Large
Mehrsprachig E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Global

	Global (global)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (Vorabversion)
Llama 3.1 70B (Vorabversion)
Llama 3.1 405B
Llama 3.2 90B (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
MiniMax M2
Mehrsprachig E5 Large
Mehrsprachig E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Nächste Schritte

Eine Notebook-Anleitung, in der der globale Endpunkt veranschaulicht wird, finden Sie unter Einführung in den globalen Vertex AI-Endpunkt.
Weitere Informationen zur Datenresidenz für generative KI in Vertex AI
Weitere Informationen zuGoogle Cloud -Regionen
Weitere Informationen zu den Sicherheitskontrollen nach Funktion
Erfahren Sie mehr über die Modelle, die Generative AI in Vertex AI-Unterstützung bieten. Siehe Referenz: Generative AI AI-Modellen.
Informationen zu Vertex AI-Standorten

Bereitstellungen und Endpunkte Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Globaler Endpunkt

Unterstützte Modelle

Globalen Endpunkt verwenden

Beschränkungen

Standorte von Google-Modellendpunkten

USA

Kanada

Brasilien

Europa

Asiatisch-pazifischer Raum

Naher Osten

Global

Google Cloud Partnermodell-Endpunktstandorte

USA

Europa

Asiatisch-pazifischer Raum

Global

Google Cloud Standorte von Open Model-Endpunkten

USA

Europa

Asiatisch-pazifischer Raum

Global

Nächste Schritte

Bereitstellungen und Endpunkte