Google- und Partnermodelle sowie generative KI-Funktionen in Vertex AI werden als bestimmte regionale Endpunkte und ein globaler Endpunkt bereitgestellt. Globale Endpunkte decken die ganze Welt ab und bieten eine höhere Verfügbarkeit und Zuverlässigkeit als einzelne Regionen.
Globaler Endpunkt
Wenn Sie einen globalen Endpunkt für Ihre Anfragen auswählen, kann die Gesamtverfügbarkeit verbessert und die Anzahl der Fehler vom Typ „Ressource erschöpft“ (429) reduziert werden. Verwenden Sie den globalen Endpunkt nicht, wenn Sie Anforderungen an die Verarbeitung von ML-Daten haben, da Sie nicht steuern oder wissen können, an welche Region Ihre Anfragen zur Verarbeitung von ML-Daten gesendet werden, wenn eine Anfrage gestellt wird.
Unterstützte Modelle
Die Verwendung des globalen Endpunkts wird für die folgenden Google-Modelle in den angegebenen Regionen unterstützt. Details dazu, in welchen Regionen der globale Endpunkt unterstützt wird, finden Sie in der Tabelle mit den Standorten der Google-Modellendpunkte auf dem Tab Global.
- Gemini 3 Flash (Vorabversion)
- Gemini 3 Pro (Vorabversion)
- Gemini 3 Pro Image (Vorabversion)
- Gemini 2.5 Pro
- Gemini 2.5 Flash (Vorabversion)
- Gemini 2.5 Flash-Lite (Vorschau)
- Gemini 2.5 Flash Image
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Informationen zur globalen Endpunktverfügbarkeit für Partnermodelle finden Sie in der Google Cloud Tabelle mit Endpunktstandorten für Partnermodelle auf dem Tab Global.
Globalen Endpunkt verwenden
Wenn Sie den globalen Endpunkt verwenden möchten, schließen Sie den Standort aus dem Endpunktnamen aus und konfigurieren Sie den Standort der Ressource auf global. Beispiel für eine globale Endpunkt-URL:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Erstellen Sie für das Google Gen AI SDK einen Client, der den global-Standort verwendet:
# google-genai >= 0.8.0 is required
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Initialisieren Sie das Vertex AI SDK für Python mit dem Standort global:
# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Beschränkungen
Die folgenden Funktionen sind bei Verwendung des globalen Endpunkts nicht verfügbar:
- Abstimmung
- Batchvorhersage für Anthropic- und OpenMaaS-Modelle
- RAG-Korpus (RAG-Anfragen werden unterstützt)
Die Verwendung des globalen Endpunkts mit bereitgestelltem Durchsatz ist nur für die folgenden Modelle verfügbar:
Klicken Sie hier, um die unterstützten Modelle für den globalen Endpunkt bei Verwendung von Provisioned Throughput aufzurufen.
| Modell | Aktuelle unterstützte Modellversion |
|---|---|
| Gemini 3 Flash Vorschau | gemini-3-flash-preview |
| Gemini 3 Pro Vorschau | gemini-3-pro-preview |
| Gemini 3 Pro Image Vorschau | gemini-3-pro-image-preview |
| Gemini 2.5 Pro | gemini-2.5-pro |
| Gemini 2.5 Flash Vorschau | gemini-2.5-flash-preview-09-2025 |
| Gemini 2.5 Flash-Lite Vorschau | gemini-2.5-flash-lite-preview-09-2025 |
| Gemini 2.5 Flash Image | gemini-2.5-flash-image |
| Gemini 2.5 Flash | gemini-2.5-flash |
| Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
| Gemini 2.0 Flash | gemini-2.0-flash-001 |
| Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Standorte von Google-Modellendpunkten
Google-Modelle in Vertex AI sind für die folgenden Endpunkte verfügbar:
Global
| Global(global) | |
|---|---|
| Gemini-Modelle | |
Gemini 3 Flash
Vorschau
(gemini-3-flash-preview)
|
|
Gemini 3 Pro
Vorschau
(gemini-3-pro-preview)
|
|
Gemini 3 Pro Image
Vorschau
(gemini-3-pro-image-preview)
|
|
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|
Gemini 2.5 Flash
Vorschau
(gemini-2.5-flash-preview-09-2025)
|
|
Gemini 2.5 Flash-Lite
Vorschau
(gemini-2.5-flash-lite-preview-09-2025)
|
|
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
|
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
(gemini-live-2.5-flash-native-audio)
|
|
Gemini 2.5 Flash mit nativer Audioausgabe über die Gemini Live API
Vorschau
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|
Gemini 2.0 Flash mit Gemini Live API
Vorschau
(gemini-2.0-flash-live-preview-04-09)
|
|
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
|
| Einbettungsmodelle | |
Gemini Embeddings
(gemini-embeddings-001)
|
|
| Einbettungen für Text | |
| Einbettungen für multimodale Konfigurationen | |
| Imagen in Vertex AI-Modelle | |
Imagen 3
(imagen-3.0-generate-002)
|
|
Imagen 3
(imagen-3.0-generate-001)
|
|
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|
Imagen 3 – kontrollierte Anpassung
(imagen-3.0-capability-001)
|
|
Imagen 4
(imagen-4.0-generate-001)
|
|
Imagen 4
(imagen-4.0-fast-generate-001)
|
|
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
|
| Veo in Vertex AI-Modelle | |
Veo 2 Generate
(veo-2.0-generate-001)
|
|
Veo 2 Generate
Vorschau
(veo-2.0-generate-exp)
|
|
Veo 2 Generate
Vorschau
(veo-2.0-generate-preview)
|
|
Veo 3 Generate
Vorschau
(veo-3.0-generate-preview)
|
|
Veo 3 Generate
Vorschau
(veo-3.0-fast-generate-preview)
|
|
Veo 3 Generate
(veo-3.0-generate-001)
|
|
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
|
Veo 3.1 Generate
Vorschau
(veo-3.1-generate-preview)
|
|
Veo 3.1 Fast Generate
Vorschau
(veo-3.1-fast-generate-preview)
|
|
Veo 3.1 Generate
(veo-3.1-generate-001)
|
|
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
|
| Speech-to-Text- und Text-to-Speech-Modelle | |
Chirp 3: Transkription
(chirp_3)
|
|
| Chirp 3: HD-Stimmen | |
| Chirp 3: Instant-Custom Voice | |
Chirp 2: Transkription
(chirp_2)
|
|
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|
Gemini 2.5 Flash Lite Preview TTS
Vorschau
(gemini-2.5-flash-lite-preview-tts)
|
|
USA
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | South Carolina(us-east1) | N. Virginia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Gemini-Modelle | |||||||
Gemini 3 Flash
Vorschau
(gemini-3-flash-preview)
|
|||||||
Gemini 3 Pro
Vorschau
(gemini-3-pro-preview)
|
|||||||
Gemini 3 Pro Image
Vorschau
(gemini-3-pro-image-preview)
|
|||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||||||
Gemini 2.5 Flash
Vorschau
(gemini-2.5-flash-preview-09-2025)
|
|||||||
Gemini 2.5 Flash-Lite
Vorschau
(gemini-2.5-flash-lite-preview-09-2025)
|
|||||||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
|||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||||||
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
(gemini-live-2.5-flash-native-audio)
|
|||||||
Gemini 2.5 Flash mit nativer Audioausgabe über die Gemini Live API
Vorschau
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||||||
Gemini 2.0 Flash mit Gemini Live API
Vorschau
(gemini-2.0-flash-live-preview-04-09)
|
|||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||||||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
|||||||
| Einbettungsmodelle | |||||||
Gemini Embeddings
(gemini-embeddings-001)
|
|||||||
| Einbettungen für Text | |||||||
| Einbettungen für multimodale Konfigurationen | |||||||
| Imagen in Vertex AI-Modelle | |||||||
Imagen 3
(imagen-3.0-generate-002)
|
|||||||
Imagen 3
(imagen-3.0-generate-001)
|
|||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||||||
Imagen 3 – kontrollierte Anpassung
(imagen-3.0-capability-001)
|
|||||||
Imagen 4
(imagen-4.0-generate-001)
|
|||||||
Imagen 4
(imagen-4.0-fast-generate-001)
|
|||||||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
|||||||
| Veo in Vertex AI-Modelle | |||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||||||
Veo 2 Generate
Vorschau
(veo-2.0-generate-exp)
|
|||||||
Veo 2 Generate
Vorschau
(veo-2.0-generate-preview)
|
|||||||
Veo 3 Generate
Vorschau
(veo-3.0-generate-preview)
|
|||||||
Veo 3 Generate
Vorschau
(veo-3.0-fast-generate-preview)
|
|||||||
Veo 3 Generate
(veo-3.0-generate-001)
|
|||||||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
|||||||
Veo 3.1 Generate
Vorschau
(veo-3.1-generate-preview)
|
|||||||
Veo 3.1 Fast Generate
Vorschau
(veo-3.1-fast-generate-preview)
|
|||||||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
|||||||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
|||||||
| Speech-to-Text- und Text-to-Speech-Modelle | |||||||
Chirp 3: Transkription
(chirp_3)
|
|||||||
| Chirp 3: HD-Stimmen | |||||||
| Chirp 3: Instant-Custom Voice | |||||||
Chirp 2: Transkription
(chirp_2)
|
|||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||||||
Gemini 2.5 Flash Lite Preview TTS
Vorschau
(gemini-2.5-flash-lite-preview-tts)
|
|||||||
Nord- und Südamerika
| Montreal(northamerica-northeast1) | São Paulo(southamerica-east1) | |
|---|---|---|
| Gemini-Modelle | ||
Gemini 3 Flash
Vorschau
(gemini-3-flash-preview)
|
||
Gemini 3 Pro
Vorschau
(gemini-3-pro-preview)
|
||
Gemini 3 Pro Image
Vorschau
(gemini-3-pro-image-preview)
|
||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
||
Gemini 2.5 Flash
Vorschau
(gemini-2.5-flash-preview-09-2025)
|
||
Gemini 2.5 Flash-Lite
Vorschau
(gemini-2.5-flash-lite-preview-09-2025)
|
||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
||
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
(gemini-live-2.5-flash-native-audio)
|
||
Gemini 2.5 Flash mit nativer Audioausgabe über die Gemini Live API
Vorschau
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
||
Gemini 2.0 Flash mit Gemini Live API
Vorschau
(gemini-2.0-flash-live-preview-04-09)
|
||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
||
| Einbettungsmodelle | ||
Gemini Embeddings
(gemini-embeddings-001)
|
||
| Einbettungen für Text | ||
| Einbettungen für multimodale Konfigurationen | ||
| Imagen in Vertex AI-Modelle | ||
Imagen 3
(imagen-3.0-generate-002)
|
||
Imagen 3
(imagen-3.0-generate-001)
|
||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
||
Imagen 3 – kontrollierte Anpassung
(imagen-3.0-capability-001)
|
||
Imagen 4
(imagen-4.0-generate-001)
|
||
Imagen 4
(imagen-4.0-fast-generate-001)
|
||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
||
| Veo in Vertex AI-Modelle | ||
Veo 2 Generate
(veo-2.0-generate-001)
|
||
Veo 2 Generate
Vorschau
(veo-2.0-generate-exp)
|
||
Veo 2 Generate
Vorschau
(veo-2.0-generate-preview)
|
||
Veo 3 Generate
Vorschau
(veo-3.0-generate-preview)
|
||
Veo 3 Generate
Vorschau
(veo-3.0-fast-generate-preview)
|
||
Veo 3 Generate
(veo-3.0-generate-001)
|
||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
||
Veo 3.1 Generate
Vorschau
(veo-3.1-generate-preview)
|
||
Veo 3.1 Fast Generate
Vorschau
(veo-3.1-fast-generate-preview)
|
||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
||
| Speech-to-Text- und Text-to-Speech-Modelle | ||
Chirp 3: Transkription
(chirp_3)
|
||
| Chirp 3: HD-Stimmen | ||
| Chirp 3: Instant-Custom Voice | ||
Chirp 2: Transkription
(chirp_2)
|
||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
||
Gemini 2.5 Flash Lite Preview TTS
Vorschau
(gemini-2.5-flash-lite-preview-tts)
|
||
Europa
| London(europe-west2) | Belgien(europe-west1) | Niederlande(europe-west4) | Zürich(europe-west6) | Frankfurt(europe-west3) | Finnland(europe-north1) | Warschau(europe-central2) | Mailand(europe-west8) | Madrid(europe-southwest1) | Paris(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Gemini-Modelle | ||||||||||
Gemini 3 Flash
Vorschau
(gemini-3-flash-preview)
|
||||||||||
Gemini 3 Pro
Vorschau
(gemini-3-pro-preview)
|
||||||||||
Gemini 3 Pro Image
Vorschau
(gemini-3-pro-image-preview)
|
||||||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
||||||||||
Gemini 2.5 Flash
Vorschau
(gemini-2.5-flash-preview-09-2025)
|
||||||||||
Gemini 2.5 Flash-Lite
Vorschau
(gemini-2.5-flash-lite-preview-09-2025)
|
||||||||||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
||||||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
||||||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
||||||||||
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
(gemini-live-2.5-flash-native-audio)
|
||||||||||
Gemini 2.5 Flash mit nativer Audioausgabe über die Gemini Live API
Vorschau
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
||||||||||
Gemini 2.0 Flash mit Gemini Live API
Vorschau
(gemini-2.0-flash-live-preview-04-09)
|
||||||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
||||||||||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
||||||||||
| Einbettungsmodelle | ||||||||||
Gemini Embeddings
(gemini-embeddings-001)
|
||||||||||
| Einbettungen für Text | ||||||||||
| Einbettungen für multimodale Konfigurationen | ||||||||||
| Imagen in Vertex AI-Modelle | ||||||||||
Imagen 3
(imagen-3.0-generate-002)
|
||||||||||
Imagen 3
(imagen-3.0-generate-001)
|
||||||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
||||||||||
Imagen 3 – kontrollierte Anpassung
(imagen-3.0-capability-001)
|
||||||||||
Imagen 4
(imagen-4.0-generate-001)
|
||||||||||
Imagen 4
(imagen-4.0-fast-generate-001)
|
||||||||||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
||||||||||
| Veo in Vertex AI-Modelle | ||||||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
||||||||||
Veo 2 Generate
Vorschau
(veo-2.0-generate-exp)
|
||||||||||
Veo 2 Generate
Vorschau
(veo-2.0-generate-preview)
|
||||||||||
Veo 3 Generate
Vorschau
(veo-3.0-generate-preview)
|
||||||||||
Veo 3 Generate
Vorschau
(veo-3.0-fast-generate-preview)
|
||||||||||
Veo 3 Generate
(veo-3.0-generate-001)
|
||||||||||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
||||||||||
Veo 3.1 Generate
Vorschau
(veo-3.1-generate-preview)
|
||||||||||
Veo 3.1 Fast Generate
Vorschau
(veo-3.1-fast-generate-preview)
|
||||||||||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
||||||||||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
||||||||||
| Speech-to-Text- und Text-to-Speech-Modelle | ||||||||||
Chirp 3: Transkription
(chirp_3)
|
||||||||||
| Chirp 3: HD-Stimmen | ||||||||||
| Chirp 3: Instant-Custom Voice | ||||||||||
Chirp 2: Transkription
(chirp_2)
|
||||||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
||||||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
||||||||||
Gemini 2.5 Flash Lite Preview TTS
Vorschau
(gemini-2.5-flash-lite-preview-tts)
|
||||||||||
Asiatisch-pazifischer Raum
| Mumbai(asia-south1) | Singapur(asia-southeast1) | Hongkong(asia-east2) | Taiwan(asia-east1) | Tokio(asia-northeast1) | Sydney(australia-southeast1) | Seoul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Gemini-Modelle | |||||||
Gemini 3 Flash
Vorschau
(gemini-3-flash-preview)
|
|||||||
Gemini 3 Pro
Vorschau
(gemini-3-pro-preview)
|
|||||||
Gemini 3 Pro Image
Vorschau
(gemini-3-pro-image-preview)
|
|||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||||||
Gemini 2.5 Flash
Vorschau
(gemini-2.5-flash-preview-09-2025)
|
|||||||
Gemini 2.5 Flash-Lite
Vorschau
(gemini-2.5-flash-lite-preview-09-2025)
|
|||||||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
|||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||||||
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
(gemini-live-2.5-flash-native-audio)
|
|||||||
Gemini 2.5 Flash mit nativer Audioausgabe über die Gemini Live API
Vorschau
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||||||
Gemini 2.0 Flash mit Gemini Live API
Vorschau
(gemini-2.0-flash-live-preview-04-09)
|
|||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||||||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
|||||||
| Einbettungsmodelle | |||||||
Gemini Embeddings
(gemini-embeddings-001)
|
|||||||
| Einbettungen für Text | |||||||
| Einbettungen für multimodale Konfigurationen | |||||||
| Imagen in Vertex AI-Modelle | |||||||
Imagen 3
(imagen-3.0-generate-002)
|
|||||||
Imagen 3
(imagen-3.0-generate-001)
|
|||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||||||
Imagen 3 – kontrollierte Anpassung
(imagen-3.0-capability-001)
|
|||||||
Imagen 4
(imagen-4.0-generate-001)
|
|||||||
Imagen 4
(imagen-4.0-fast-generate-001)
|
|||||||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
|||||||
| Veo in Vertex AI-Modelle | |||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||||||
Veo 2 Generate
Vorschau
(veo-2.0-generate-exp)
|
|||||||
Veo 2 Generate
Vorschau
(veo-2.0-generate-preview)
|
|||||||
Veo 3 Generate
Vorschau
(veo-3.0-generate-preview)
|
|||||||
Veo 3 Generate
Vorschau
(veo-3.0-fast-generate-preview)
|
|||||||
Veo 3 Generate
(veo-3.0-generate-001)
|
|||||||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
|||||||
Veo 3.1 Generate
Vorschau
(veo-3.1-generate-preview)
|
|||||||
Veo 3.1 Fast Generate
Vorschau
(veo-3.1-fast-generate-preview)
|
|||||||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
|||||||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
|||||||
| Speech-to-Text- und Text-to-Speech-Modelle | |||||||
Chirp 3: Transkription
(chirp_3)
|
|||||||
| Chirp 3: HD-Stimmen | |||||||
| Chirp 3: Instant-Custom Voice | |||||||
Chirp 2: Transkription
(chirp_2)
|
|||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||||||
Gemini 2.5 Flash Lite Preview TTS
Vorschau
(gemini-2.5-flash-lite-preview-tts)
|
|||||||
Naher Osten
| Tel Aviv(me-west1) | Doha(me-central1) | Dammam(me-central2) | |
|---|---|---|---|
| Gemini-Modelle | |||
Gemini 3 Flash
Vorschau
(gemini-3-flash-preview)
|
|||
Gemini 3 Pro
Vorschau
(gemini-3-pro-preview)
|
|||
Gemini 3 Pro Image
Vorschau
(gemini-3-pro-image-preview)
|
|||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||
Gemini 2.5 Flash
Vorschau
(gemini-2.5-flash-preview-09-2025)
|
|||
Gemini 2.5 Flash-Lite
Vorschau
(gemini-2.5-flash-lite-preview-09-2025)
|
|||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
|||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||
Gemini 2.5 Flash mit nativer Audioausgabe der Gemini Live API
(gemini-live-2.5-flash-native-audio)
|
|||
Gemini 2.5 Flash mit nativer Audioausgabe über die Gemini Live API
Vorschau
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||
Gemini 2.0 Flash mit Gemini Live API
Vorschau
(gemini-2.0-flash-live-preview-04-09)
|
|||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
|||
| Einbettungsmodelle | |||
Gemini Embeddings
(gemini-embeddings-001)
|
|||
| Einbettungen für Text | |||
| Einbettungen für multimodale Konfigurationen | |||
| Imagen in Vertex AI-Modelle | |||
Imagen 3
(imagen-3.0-generate-002)
|
|||
Imagen 3
(imagen-3.0-generate-001)
|
|||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||
Imagen 3 – kontrollierte Anpassung
(imagen-3.0-capability-001)
|
|||
Imagen 4
(imagen-4.0-generate-001)
|
|||
Imagen 4
(imagen-4.0-fast-generate-001)
|
|||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
|||
| Veo in Vertex AI-Modelle | |||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||
Veo 2 Generate
Vorschau
(veo-2.0-generate-exp)
|
|||
Veo 2 Generate
Vorschau
(veo-2.0-generate-preview)
|
|||
Veo 3 Generate
Vorschau
(veo-3.0-generate-preview)
|
|||
Veo 3 Generate
Vorschau
(veo-3.0-fast-generate-preview)
|
|||
Veo 3 Generate
(veo-3.0-generate-001)
|
|||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
|||
Veo 3.1 Generate
Vorschau
(veo-3.1-generate-preview)
|
|||
Veo 3.1 Fast Generate
Vorschau
(veo-3.1-fast-generate-preview)
|
|||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
|||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
|||
| Speech-to-Text- und Text-to-Speech-Modelle | |||
Chirp 3: Transkription
(chirp_3)
|
|||
| Chirp 3: HD-Stimmen | |||
| Chirp 3: Instant-Custom Voice | |||
Chirp 2: Transkription
(chirp_2)
|
|||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||
Gemini 2.5 Flash Lite Preview TTS
Vorschau
(gemini-2.5-flash-lite-preview-tts)
|
|||
Google Cloud Partnermodell-Endpunktstandorte
Google bearbeitet Anfragen aus der von Ihnen angegebenen Region. Für einige Modelle bietet Google auch einen globalen Endpunkt an, um die allgemeine Verfügbarkeit zu verbessern und die Fehlerraten zu senken. Der globale Endpunkt kann separate Kontingente für den regionalen Endpunkt haben und unterstützt keine Anforderungen an den Datenstandort. Weitere Informationen finden Sie im Abschnitt „Regional and global endpoint“ unter Vertex AI-Partnermodelle für MaaS.
Endpunkte für Partnermodelle für Generative AI in Vertex AI sind in den folgenden Regionen verfügbar:
Global
| Global(global) | |
|---|---|
| Anthropic-Modelle | |
| Claude Opus 4.6 | |
| Claude Opus 4.5 | |
| Claude Sonnet 4.5 | |
| Claude Opus 4.1 | |
| Claude Haiku 4.5 | |
| Claude Opus 4 | |
| Claude Sonnet 4 | |
| Claude 3.7 Sonnet von Anthropic | |
| Claude 3.5 Haiku von Anthropic | |
| Claude 3 Haiku von Anthropic | |
| Mistral-Modelle | |
| Mistral Medium 3 | |
| Mistral OCR (25.05) | |
| Mistral Small 3.1 (25.03) | |
| Mistral Large (24.07) | |
| Codestral 2 | |
| Codestral (24.05) | |
USA
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | South Carolina(us-east1) | N. Virginia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Anthropic-Modelle | |||||||
| Claude Opus 4.6 | |||||||
| Claude Opus 4.5 | |||||||
| Claude Sonnet 4.5 | |||||||
| Claude Opus 4.1 | |||||||
| Claude Haiku 4.5 | |||||||
| Claude Opus 4 | |||||||
| Claude Sonnet 4 | |||||||
| Claude 3.7 Sonnet von Anthropic | |||||||
| Claude 3.5 Haiku von Anthropic | |||||||
| Claude 3 Haiku von Anthropic | |||||||
| Mistral-Modelle | |||||||
| Mistral Medium 3 | |||||||
| Mistral OCR (25.05) | |||||||
| Mistral Small 3.1 (25.03) | |||||||
| Mistral Large (24.07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) | |||||||
Nord- und Südamerika
| Montreal(northamerica-northeast1) | São Paulo(southamerica-east1) | |
|---|---|---|
| Anthropic-Modelle | ||
| Claude Opus 4.6 | ||
| Claude Opus 4.5 | ||
| Claude Sonnet 4.5 | ||
| Claude Opus 4.1 | ||
| Claude Haiku 4.5 | ||
| Claude Opus 4 | ||
| Claude Sonnet 4 | ||
| Claude 3.7 Sonnet von Anthropic | ||
| Claude 3.5 Haiku von Anthropic | ||
| Claude 3 Haiku von Anthropic | ||
| Mistral-Modelle | ||
| Mistral Medium 3 | ||
| Mistral OCR (25.05) | ||
| Mistral Small 3.1 (25.03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) | ||
Europa
| London(europe-west2) | Belgien(europe-west1) | Niederlande(europe-west4) | Zürich(europe-west6) | Frankfurt(europe-west3) | Finnland(europe-north1) | Warschau(europe-central2) | Mailand(europe-west8) | Madrid(europe-southwest1) | Paris(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Anthropic-Modelle | ||||||||||
| Claude Opus 4.6 | ||||||||||
| Claude Opus 4.5 | ||||||||||
| Claude Sonnet 4.5 | ||||||||||
| Claude Opus 4.1 | ||||||||||
| Claude Haiku 4.5 | ||||||||||
| Claude Opus 4 | ||||||||||
| Claude Sonnet 4 | ||||||||||
| Claude 3.7 Sonnet von Anthropic | ||||||||||
| Claude 3.5 Haiku von Anthropic | ||||||||||
| Claude 3 Haiku von Anthropic | ||||||||||
| Mistral-Modelle | ||||||||||
| Mistral Medium 3 | ||||||||||
| Mistral OCR (25.05) | ||||||||||
| Mistral Small 3.1 (25.03) | ||||||||||
| Mistral Large (24.07) | ||||||||||
| Codestral 2 | ||||||||||
| Codestral (24.05) | ||||||||||
Asiatisch-pazifischer Raum
| Mumbai(asia-south1) | Singapur(asia-southeast1) | Hongkong(asia-east2) | Taiwan(asia-east1) | Tokio(asia-northeast1) | Sydney(australia-southeast1) | Seoul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Anthropic-Modelle | |||||||
| Claude Opus 4.6 | |||||||
| Claude Opus 4.5 | |||||||
| Claude Sonnet 4.5 | |||||||
| Claude Opus 4.1 | |||||||
| Claude Haiku 4.5 | |||||||
| Claude Opus 4 | |||||||
| Claude Sonnet 4 | |||||||
| Claude 3.7 Sonnet von Anthropic | |||||||
| Claude 3.5 Haiku von Anthropic | |||||||
| Claude 3 Haiku von Anthropic | |||||||
| Mistral-Modelle | |||||||
| Mistral Medium 3 | |||||||
| Mistral OCR (25.05) | |||||||
| Mistral Small 3.1 (25.03) | |||||||
| Mistral Large (24.07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) | |||||||
Naher Osten
| Tel Aviv(me-west1) | Doha(me-central1) | Dammam(me-central2) | |
|---|---|---|---|
| Anthropic-Modelle | |||
| Claude Opus 4.6 | |||
| Claude Opus 4.5 | |||
| Claude Sonnet 4.5 | |||
| Claude Opus 4.1 | |||
| Claude Haiku 4.5 | |||
| Claude Opus 4 | |||
| Claude Sonnet 4 | |||
| Claude 3.7 Sonnet von Anthropic | |||
| Claude 3.5 Haiku von Anthropic | |||
| Claude 3 Haiku von Anthropic | |||
| Mistral-Modelle | |||
| Mistral Medium 3 | |||
| Mistral OCR (25.05) | |||
| Mistral Small 3.1 (25.03) | |||
| Mistral Large (24.07) | |||
| Codestral 2 | |||
| Codestral (24.05) | |||
Google Cloud Standorte von Open Model-Endpunkten
Google bearbeitet Anfragen aus der von Ihnen angegebenen Region. Für einige Modelle bietet Google auch einen globalen Endpunkt an, um die allgemeine Verfügbarkeit zu verbessern und die Fehlerraten zu senken. Der globale Endpunkt kann separate Kontingente für den regionalen Endpunkt haben und unterstützt keine Anforderungen an den Datenstandort. Weitere Informationen finden Sie im Abschnitt „Regionale und globale Endpunkte“ unter Offene Vertex AI-Modelle für MaaS.
Endpunkte für offene Modelle für generative KI in Vertex AI sind in den folgenden Regionen verfügbar:
Global
| Global(global) | |
|---|---|
| Deepseek-Modelle | |
DeepSeek-OCR
(deepseek-ocr-maas)
|
|
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|
| ZAI.org-Modelle | |
GLM 4.7
(glm-4.7-maas)
|
|
GLM 5
(glm-5-maas)
|
|
| OpenAI-Modelle | |
gpt-oss 120B
(gpt-oss-120b-maas)
|
|
gpt-oss 20B
(gpt-oss-20b-maas)
|
|
| Moonshot AI-Modelle | |
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|
| Llama-Modelle | |
| Llama 3.3 70B | |
| Llama 4 Maverick 17B-128E | |
| Llama 4 Scout 17B-16E | |
| MiniMax-Modelle | |
MiniMax M2
(minimax-m2-maas)
|
|
| Qwen-Modelle | |
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|
| e5-Modelle | |
Mehrsprachig E5 Small
(multilingual-e5-small-maas)
|
|
Multilingual E5 Large
(multilingual-e5-large-instruct-maas)
|
|
USA
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | South Carolina(us-east1) | N. Virginia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Deepseek-Modelle | |||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||||||
| ZAI.org-Modelle | |||||||
GLM 4.7
(glm-4.7-maas)
|
|||||||
GLM 5
(glm-5-maas)
|
|||||||
| OpenAI-Modelle | |||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||||||
| Moonshot AI-Modelle | |||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||||||
| Llama-Modelle | |||||||
| Llama 3.3 70B | |||||||
| Llama 4 Maverick 17B-128E | |||||||
| Llama 4 Scout 17B-16E | |||||||
| MiniMax-Modelle | |||||||
MiniMax M2
(minimax-m2-maas)
|
|||||||
| Qwen-Modelle | |||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||||||
| e5-Modelle | |||||||
Mehrsprachig E5 Small
(multilingual-e5-small-maas)
|
|||||||
Mehrsprachig E5 Large
(multilingual-e5-large-instruct-maas)
|
|||||||
Nord- und Südamerika
| Montreal(northamerica-northeast1) | São Paulo(southamerica-east1) | |
|---|---|---|
| Deepseek-Modelle | ||
DeepSeek-OCR
(deepseek-ocr-maas)
|
||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
||
| ZAI.org-Modelle | ||
GLM 4.7
(glm-4.7-maas)
|
||
GLM 5
(glm-5-maas)
|
||
| OpenAI-Modelle | ||
gpt-oss 120B
(gpt-oss-120b-maas)
|
||
gpt-oss 20B
(gpt-oss-20b-maas)
|
||
| Moonshot AI-Modelle | ||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
||
| Llama-Modelle | ||
| Llama 3.3 70B | ||
| Llama 4 Maverick 17B-128E | ||
| Llama 4 Scout 17B-16E | ||
| MiniMax-Modelle | ||
MiniMax M2
(minimax-m2-maas)
|
||
| Qwen-Modelle | ||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
||
| e5-Modelle | ||
Mehrsprachig E5 Small
(multilingual-e5-small-maas)
|
||
Mehrsprachig E5 Large
(multilingual-e5-large-instruct-maas)
|
||
Europa
| London(europe-west2) | Belgien(europe-west1) | Niederlande(europe-west4) | Zürich(europe-west6) | Frankfurt(europe-west3) | Finnland(europe-north1) | Warschau(europe-central2) | Mailand(europe-west8) | Madrid(europe-southwest1) | Paris(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Deepseek-Modelle | ||||||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
||||||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
||||||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
||||||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
||||||||||
| ZAI.org-Modelle | ||||||||||
GLM 4.7
(glm-4.7-maas)
|
||||||||||
GLM 5
(glm-5-maas)
|
||||||||||
| OpenAI-Modelle | ||||||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
||||||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
||||||||||
| Moonshot AI-Modelle | ||||||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
||||||||||
| Llama-Modelle | ||||||||||
| Llama 3.3 70B | ||||||||||
| Llama 4 Maverick 17B-128E | ||||||||||
| Llama 4 Scout 17B-16E | ||||||||||
| MiniMax-Modelle | ||||||||||
MiniMax M2
(minimax-m2-maas)
|
||||||||||
| Qwen-Modelle | ||||||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
||||||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
||||||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
||||||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
||||||||||
| e5-Modelle | ||||||||||
Mehrsprachig E5 Small
(multilingual-e5-small-maas)
|
||||||||||
Mehrsprachig E5 Large
(multilingual-e5-large-instruct-maas)
|
||||||||||
Asiatisch-pazifischer Raum
| Mumbai(asia-south1) | Singapur(asia-southeast1) | Hongkong(asia-east2) | Taiwan(asia-east1) | Tokio(asia-northeast1) | Sydney(australia-southeast1) | Seoul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Deepseek-Modelle | |||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||||||
| ZAI.org-Modelle | |||||||
GLM 4.7
(glm-4.7-maas)
|
|||||||
GLM 5
(glm-5-maas)
|
|||||||
| OpenAI-Modelle | |||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||||||
| Moonshot AI-Modelle | |||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||||||
| Llama-Modelle | |||||||
| Llama 3.3 70B | |||||||
| Llama 4 Maverick 17B-128E | |||||||
| Llama 4 Scout 17B-16E | |||||||
| MiniMax-Modelle | |||||||
MiniMax M2
(minimax-m2-maas)
|
|||||||
| Qwen-Modelle | |||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||||||
| e5-Modelle | |||||||
Mehrsprachig E5 Small
(multilingual-e5-small-maas)
|
|||||||
Mehrsprachig E5 Large
(multilingual-e5-large-instruct-maas)
|
|||||||
Naher Osten
| Tel Aviv(me-west1) | Doha(me-central1) | Dammam(me-central2) | |
|---|---|---|---|
| Deepseek-Modelle | |||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||
| ZAI.org-Modelle | |||
GLM 4.7
(glm-4.7-maas)
|
|||
GLM 5
(glm-5-maas)
|
|||
| OpenAI-Modelle | |||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||
| Moonshot AI-Modelle | |||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||
| Llama-Modelle | |||
| Llama 3.3 70B | |||
| Llama 4 Maverick 17B-128E | |||
| Llama 4 Scout 17B-16E | |||
| MiniMax-Modelle | |||
MiniMax M2
(minimax-m2-maas)
|
|||
| Qwen-Modelle | |||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||
| e5-Modelle | |||
Mehrsprachig E5 Small
(multilingual-e5-small-maas)
|
|||
Multilingual E5 Large
(multilingual-e5-large-instruct-maas)
|
|||
Nächste Schritte
- Weitere Informationen zur Datenresidenz für generative KI in Vertex AI
- Informationen zuGoogle Cloud -Regionen
- Weitere Informationen zu den Sicherheitskontrollen nach Funktion
- Erfahren Sie mehr über die Modelle, die Generative AI in Vertex AI-Unterstützung bieten. Siehe Referenz: Generative AI AI-Modellen.
- Informationen zu Vertex AI-Standorten