Bereitstellungen und Endpunkte

Google- und Partnermodelle sowie generative KI-Funktionen in Vertex AI werden als bestimmte regionale Endpunkte und ein globaler Endpunkt bereitgestellt. Globale Endpunkte decken die ganze Welt ab und bieten eine höhere Verfügbarkeit und Zuverlässigkeit als einzelne Regionen.

Modellendpunkte garantieren keine regionale Verfügbarkeit oder regionale ML-Verarbeitung. Informationen zum Datenstandort finden Sie unter Datenstandort.

Globaler Endpunkt

Wenn Sie einen globalen Endpunkt für Ihre Anfragen auswählen, kann die Gesamtverfügbarkeit verbessert und die Anzahl der Fehler vom Typ „Ressource exhausted“ (429) reduziert werden. Verwenden Sie den globalen Endpunkt nicht, wenn Sie Anforderungen an die Verarbeitung von ML haben, da Sie nicht steuern oder wissen können, an welche Region Ihre Anfragen zur Verarbeitung von ML gesendet werden, wenn eine Anfrage gestellt wird.

Unterstützte Modelle

Die Verwendung des globalen Endpunkts wird für die folgenden Google-Modelle in den angegebenen Regionen unterstützt. Details dazu, in welchen Regionen der globale Endpunkt unterstützt wird, finden Sie in der Tabelle mit den Standorten der Google-Modellendpunkte auf dem Tab Global.

Informationen zur globalen Endpunktverfügbarkeit für Partnermodelle finden Sie in der Google Cloud Tabelle mit Endpunktstandorten für Partnermodelle auf dem Tab Global.

Globalen Endpunkt verwenden

Wenn Sie den globalen Endpunkt verwenden möchten, schließen Sie den Standort aus dem Endpunktnamen aus und konfigurieren Sie den Standort der Ressource auf global. Beispiel für eine globale Endpunkt-URL:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Erstellen Sie für das Google Gen AI SDK einen Client, der den global-Standort verwendet:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Initialisieren Sie das Vertex AI SDK für Python mit dem Standort global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Beschränkungen

Die folgenden Funktionen sind bei Verwendung des globalen Endpunkts nicht verfügbar:

  • Abstimmung
  • Batchvorhersage
  • RAG-Corpus (RAG-Anfragen werden unterstützt)

Die Verwendung des globalen Endpunkts mit bereitgestelltem Durchsatz ist nur für die folgenden Modelle verfügbar:

Modell Neueste unterstützte Modellversion
Gemini 2.5 Flash (Vorschau) gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite (Vorschau) gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Standorte von Google-Modellendpunkten

Google-Modellendpunkte für generative KI in Vertex AI sind in den folgenden Regionen verfügbar.

USA

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, South Carolina (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3: Bearbeitung und Anpassung
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (experimentell)
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (Vorabversion)
(veo-3.0-generate-preview)
Veo 3 Fast (Vorabversion)
(veo-3.0-fast-generate-preview)
Chirp 3: Transkription (chirp_3)
Chirp 2: Transkription (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Kanada

Montreal (northamerica-northeast1)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3: Bearbeitung und Anpassung
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (experimentell)
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkription (chirp_3)
Chirp 2: Transkription (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Südamerika

São Paulo, Brasilien (southamerica-east1)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3: Bearbeitung und Anpassung
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (experimentell)
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkription (chirp_3)
Chirp 2: Transkription (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Europa

Niederlande (europe-west4) Paris, Frankreich (europe-west9) London, Vereinigtes Königreich (europe-west2) Frankfurt, Deutschland (europe-west3) Belgien (europe-west1) Zürich, Schweiz (europe-west6) Madrid, Spanien (europe-southwest1) Mailand, Italien (europe-west8) Finnland (europe-north1) Warschau, Polen (europe-central2)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3: Bearbeitung und Anpassung
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (experimentell)
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkription (chirp_3)
Chirp 2: Transkription (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Asiatisch-pazifischer Raum

Tokio, Japan (asia-northeast1) Sydney, Australien (australia-southeast1) Singapur (asia-southeast1) Seoul, Korea (asia-northeast3) Taiwan (asia-east1) Hongkong, China (asia-east2) Mumbai, Indien (asia-south1)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
*
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3: Bearbeitung und Anpassung
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (experimentell)
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkription (chirp_3)
Chirp 2: Transkription (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Naher Osten

Dammam, Saudi-Arabien (me-central2) Doha, Katar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3: Bearbeitung und Anpassung
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (experimentell)
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkription (chirp_3)
Chirp 2: Transkription (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

Global

Global (global)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash mit nativer Audio-Live-API
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Einbettungen für Text
Einbettungen für multimodale Konfigurationen
Imagen für Untertitel und VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3: Bearbeitung und Anpassung
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (experimentell)
(imagen-4.0-ultra-generate-001)
Chirp 3: Transkription (chirp_3)
Chirp 2: Transkription (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: HD-Stimmen
Chirp 3: Instant-Custom Voice

* Die Region ist nur verfügbar, wenn Sie Provisioned Throughput für einzelne Zonen oder die Batchvorhersage verwenden. Supervised Fine-Tuning wird in dieser Region nicht unterstützt.

Google Cloud Standorte von Partnermodellendpunkten

Google bearbeitet Anfragen aus der von Ihnen angegebenen Region. Für einige Modelle bietet Google auch einen globalen Endpunkt an, um die allgemeine Verfügbarkeit zu verbessern und die Fehlerraten zu senken. Der globale Endpunkt kann ein separates Kontingent für den regionalen Endpunkt haben und unterstützt keine Anforderungen an den Datenstandort. Weitere Informationen finden Sie im Abschnitt „Regional and global endpoint“ unter Vertex AI-Partnermodelle für MaaS.

Endpunkte für Partnermodelle für Generative AI in Vertex AI sind in den folgenden Regionen verfügbar:

USA

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, South Carolina (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
Claude Sonnet 4.5 von Anthropic
Claude Opus 4.1 von Anthropic
Claude Haiku 4.5 von Anthropic
Claude Opus 4 von Anthropic
Claude Sonnet 4 von Anthropic
Claude 3.7 Sonnet von Anthropic
Claude 3.5 Haiku von Anthropic
Anthropic Claude 3 Haiku
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

Niederlande (europe-west4) Belgien (europe-west1)
Claude Sonnet 4.5 von Anthropic
Claude Opus 4.1 von Anthropic
Claude Haiku 4.5
Claude Opus 4 von Anthropic
Claude Sonnet 4 von Anthropic
Claude 3.7 Sonnet von Anthropic
Claude 3.5 Haiku von Anthropic
Anthropic Claude 3 Haiku
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asiatisch-pazifischer Raum

Singapur (asia-southeast1) Taiwan (asia-east1)
Claude Sonnet 4.5 von Anthropic
Claude Opus 4.1 von Anthropic
Claude Haiku 4.5 von Anthropic
Claude Opus 4 von Anthropic
Claude Sonnet 4 von Anthropic
Claude 3.7 Sonnet von Anthropic
Claude 3.5 Haiku von Anthropic
Anthropic Claude 3 Haiku
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

Global (global)
Claude Sonnet 4.5 von Anthropic
Claude Opus 4.1 von Anthropic
Claude Haiku 4.5 von Anthropic
Claude Opus 4 von Anthropic
Claude Sonnet 4 von Anthropic
Claude 3.7 Sonnet von Anthropic
Claude 3.5 Haiku von Anthropic
Anthropic Claude 3 Haiku
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud Standorte von Open Model-Endpunkten

Google bearbeitet Anfragen aus der von Ihnen angegebenen Region. Für einige Modelle bietet Google auch einen globalen Endpunkt an, um die allgemeine Verfügbarkeit zu verbessern und die Fehlerraten zu senken. Der globale Endpunkt kann ein separates Kontingent für den regionalen Endpunkt haben und unterstützt keine Anforderungen an den Datenstandort. Weitere Informationen finden Sie im Abschnitt „Regionale und globale Endpunkte“ unter Vertex AI Open Models for MaaS.

Endpunkte für offene Modelle für generative KI in Vertex AI sind in den folgenden Regionen verfügbar:

USA

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, South Carolina (us-east1) Northern Virginia (us-east4) Oregon (us-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 3.2 90B (Vorabversion)
Llama 3.1 405B
Llama 3.1 70B (Vorabversion)
Llama 3.1 8B (Vorabversion)
Mehrsprachig E5 Small
Mehrsprachig E5 Large

Europa

Niederlande (europe-west4) Belgien (europe-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 3.2 90B (Vorabversion)
Llama 3.1 405B
Llama 3.1 70B (Vorabversion)
Llama 3.1 8B (Vorabversion)
Mehrsprachig E5 Small
Mehrsprachig E5 Large

Asiatisch-pazifischer Raum

Singapur (asia-southeast1) Taiwan (asia-east1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 3.2 90B (Vorabversion)
Llama 3.1 405B
Llama 3.1 70B (Vorabversion)
Llama 3.1 8B (Vorabversion)

Global

Global (global)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (Vorabversion)
Llama 4 Scout 17B-16E (Vorabversion)
Llama 3.3 70B (Vorabversion)
Llama 3.2 90B (Vorabversion)
Llama 3.1 405B
Llama 3.1 70B (Vorabversion)
Llama 3.1 8B (Vorabversion)

Nächste Schritte