Déploiements et points de terminaison

Les modèles Google et des partenaires, ainsi que les fonctionnalités d'IA générative sur Vertex AI, sont exposés sous la forme de points de terminaison régionaux spécifiques et d'un point de terminaison global. Les points de terminaison globaux couvrent le monde entier et offrent une disponibilité et une fiabilité supérieures à celles des régions uniques.

Point de terminaison global

La sélection d'un point de terminaison global pour vos requêtes peut améliorer la disponibilité générale tout en réduisant les erreurs d'épuisement des ressources (429). N'utilisez pas le point de terminaison global si vous avez des exigences en termes de traitement ML, car vous ne pouvez pas contrôler ni savoir à quelle région vos requêtes de traitement ML sont envoyées lorsqu'une requête est effectuée.

Modèles compatibles

L'utilisation du point de terminaison global est compatible avec les modèles Google suivants dans les régions spécifiées. Pour savoir quelles régions sont compatibles avec le point de terminaison mondial, consultez l'onglet Global dans le tableau des emplacements des points de terminaison des modèles Google.

Pour en savoir plus sur la disponibilité mondiale des points de terminaison pour les modèles partenaires, consultez l'onglet Global dans le tableau des emplacements des points de terminaison des modèles partenaires.Google Cloud

Utiliser le point de terminaison global

Pour utiliser le point de terminaison global, excluez l'emplacement du nom du point de terminaison et configurez l'emplacement de la ressource sur global. Voici un exemple d'URL de point de terminaison global :

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Pour le SDK Google Gen AI, créez un client qui utilise l'emplacement global :

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Pour le SDK Vertex AI pour Python, initialisez le SDK à l'aide de l'emplacement global :

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limites

Les fonctionnalités suivantes ne sont pas disponibles lorsque vous utilisez le point de terminaison global :

Réglage
Prédiction par lot pour les modèles Anthropic et OpenMaaS
Corpus de génération augmentée par récupération (RAG) (les requêtes RAG sont acceptées)

L'utilisation du point de terminaison global avec le débit provisionné n'est disponible que pour les modèles suivants :

Cliquez pour afficher les modèles compatibles avec le point de terminaison mondial lorsque vous utilisez le débit provisionné.

Modèle	Dernière version de modèle compatible
Gemini 3 Flash preview	`gemini-3-flash-preview`
Gemini 3 Pro preview	`gemini-3-pro-preview`
Image Gemini 3 Pro preview	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash preview	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite preview	`gemini-2.5-flash-lite-preview-09-2025`
Image Gemini 2.5 Flash	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Emplacements des points de terminaison des modèles Google

Les modèles Google dans Vertex AI sont disponibles pour les points de terminaison suivants :

Monde

	Global(global)
Modèles Gemini
Gemini 3 Flash preview `(gemini-3-flash-preview)`
Gemini 3 Pro preview `(gemini-3-pro-preview)`
Image Gemini 3 Pro preview `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash preview `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite preview `(gemini-2.5-flash-lite-preview-09-2025)`
Image Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash avec l'API Gemini Live et l'audio natif `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live preview `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash avec l'API Gemini Live preview `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modèles d'embeddings
Embeddings Gemini `(gemini-embeddings-001)`
Embeddings pour le texte
Embeddings multimodaux
Modèles Imagen sur Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personnalisation contrôlée Imagen 3 `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Génération Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modèles Veo sur Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate aperçu `(veo-2.0-generate-exp)`
Veo 2 Generate aperçu `(veo-2.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-fast-generate-preview)`
Génération Veo 3 `(veo-3.0-generate-001)`
Veo 3 Fast Générer `(veo-3.0-fast-generate-001)`
Veo 3.1 Générer preview `(veo-3.1-generate-preview)`
Générer rapidement avec Veo 3.1 preview `(veo-3.1-fast-generate-preview)`
Veo 3.1 Générer `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription `(chirp_3)`
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Aperçu de Gemini 2.5 Flash Lite TTS preview `(gemini-2.5-flash-lite-preview-tts)`

États-Unis

	Oregon(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Caroline du Sud(us-east1)	N. Virginie(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modèles Gemini
Gemini 3 Flash preview `(gemini-3-flash-preview)`
Gemini 3 Pro preview `(gemini-3-pro-preview)`
Image Gemini 3 Pro preview `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash preview `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite preview `(gemini-2.5-flash-lite-preview-09-2025)`
Image Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash avec l'API Gemini Live et l'audio natif `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live preview `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash avec l'API Gemini Live preview `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modèles d'embeddings
Embeddings Gemini `(gemini-embeddings-001)`
Embeddings pour le texte
Embeddings multimodaux
Modèles Imagen sur Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personnalisation contrôlée Imagen 3 `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Génération Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modèles Veo sur Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate aperçu `(veo-2.0-generate-exp)`
Veo 2 Generate aperçu `(veo-2.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-fast-generate-preview)`
Génération Veo 3 `(veo-3.0-generate-001)`
Veo 3 Fast Générer `(veo-3.0-fast-generate-001)`
Veo 3.1 Générer preview `(veo-3.1-generate-preview)`
Générer rapidement avec Veo 3.1 preview `(veo-3.1-fast-generate-preview)`
Veo 3.1 Générer `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription `(chirp_3)`
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Aperçu de Gemini 2.5 Flash Lite TTS preview `(gemini-2.5-flash-lite-preview-tts)`

Amériques

	Montréal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modèles Gemini
Gemini 3 Flash preview `(gemini-3-flash-preview)`
Gemini 3 Pro preview `(gemini-3-pro-preview)`
Image Gemini 3 Pro preview `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash preview `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite preview `(gemini-2.5-flash-lite-preview-09-2025)`
Image Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash avec l'API Gemini Live et l'audio natif `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live preview `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash avec l'API Gemini Live preview `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modèles d'embeddings
Embeddings Gemini `(gemini-embeddings-001)`
Embeddings pour le texte
Embeddings multimodaux
Modèles Imagen sur Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personnalisation contrôlée Imagen 3 `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Génération Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modèles Veo sur Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate aperçu `(veo-2.0-generate-exp)`
Veo 2 Generate aperçu `(veo-2.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-fast-generate-preview)`
Génération Veo 3 `(veo-3.0-generate-001)`
Veo 3 Fast Générer `(veo-3.0-fast-generate-001)`
Veo 3.1 Générer preview `(veo-3.1-generate-preview)`
Générer rapidement avec Veo 3.1 preview `(veo-3.1-fast-generate-preview)`
Veo 3.1 Générer `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription `(chirp_3)`
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Aperçu de Gemini 2.5 Flash Lite TTS preview `(gemini-2.5-flash-lite-preview-tts)`

Europe

	Londres(europe-west2)	Belgique(europe-west1)	Pays-Bas(europe-west4)	Zurich(europe-west6)	Francfort(europe-west3)	Finlande(europe-north1)	Varsovie(europe-central2)	Milan(europe-west8)	Madrid(europe-southwest1)	Paris(europe-west9)
Modèles Gemini
Gemini 3 Flash preview `(gemini-3-flash-preview)`
Gemini 3 Pro preview `(gemini-3-pro-preview)`
Image Gemini 3 Pro preview `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash preview `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite preview `(gemini-2.5-flash-lite-preview-09-2025)`
Image Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash avec l'API Gemini Live et l'audio natif `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live preview `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash avec l'API Gemini Live preview `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modèles d'embeddings
Embeddings Gemini `(gemini-embeddings-001)`
Embeddings pour le texte
Embeddings multimodaux
Modèles Imagen sur Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personnalisation contrôlée Imagen 3 `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Génération Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modèles Veo sur Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate aperçu `(veo-2.0-generate-exp)`
Veo 2 Generate aperçu `(veo-2.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-fast-generate-preview)`
Génération Veo 3 `(veo-3.0-generate-001)`
Veo 3 Fast Générer `(veo-3.0-fast-generate-001)`
Veo 3.1 Générer preview `(veo-3.1-generate-preview)`
Générer rapidement avec Veo 3.1 preview `(veo-3.1-fast-generate-preview)`
Veo 3.1 Générer `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription `(chirp_3)`
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Aperçu de Gemini 2.5 Flash Lite TTS preview `(gemini-2.5-flash-lite-preview-tts)`

Asie-Pacifique

	Mumbai(asia-south1)	Singapour(asia-southeast1)	Hong Kong(asia-east2)	Taïwan(asia-east1)	Tokyo(asia-northeast1)	Sydney(australia-southeast1)	Séoul(asia-northeast3)
Modèles Gemini
Gemini 3 Flash preview `(gemini-3-flash-preview)`
Gemini 3 Pro preview `(gemini-3-pro-preview)`
Image Gemini 3 Pro preview `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash preview `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite preview `(gemini-2.5-flash-lite-preview-09-2025)`
Image Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash avec l'API Gemini Live et l'audio natif `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live preview `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash avec l'API Gemini Live preview `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modèles d'embeddings
Embeddings Gemini `(gemini-embeddings-001)`
Embeddings pour le texte
Embeddings multimodaux
Modèles Imagen sur Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personnalisation contrôlée Imagen 3 `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Génération Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modèles Veo sur Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate aperçu `(veo-2.0-generate-exp)`
Veo 2 Generate aperçu `(veo-2.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-fast-generate-preview)`
Génération Veo 3 `(veo-3.0-generate-001)`
Veo 3 Fast Générer `(veo-3.0-fast-generate-001)`
Veo 3.1 Générer preview `(veo-3.1-generate-preview)`
Générer rapidement avec Veo 3.1 preview `(veo-3.1-fast-generate-preview)`
Veo 3.1 Générer `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription `(chirp_3)`
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Aperçu de Gemini 2.5 Flash Lite TTS preview `(gemini-2.5-flash-lite-preview-tts)`

Moyen-Orient

	Tel-Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modèles Gemini
Gemini 3 Flash preview `(gemini-3-flash-preview)`
Gemini 3 Pro preview `(gemini-3-pro-preview)`
Image Gemini 3 Pro preview `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash preview `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite preview `(gemini-2.5-flash-lite-preview-09-2025)`
Image Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash avec l'API Gemini Live et l'audio natif `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live preview `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash avec l'API Gemini Live preview `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modèles d'embeddings
Embeddings Gemini `(gemini-embeddings-001)`
Embeddings pour le texte
Embeddings multimodaux
Modèles Imagen sur Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personnalisation contrôlée Imagen 3 `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Génération Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modèles Veo sur Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate aperçu `(veo-2.0-generate-exp)`
Veo 2 Generate aperçu `(veo-2.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-generate-preview)`
Veo 3 Generate preview `(veo-3.0-fast-generate-preview)`
Génération Veo 3 `(veo-3.0-generate-001)`
Veo 3 Fast Générer `(veo-3.0-fast-generate-001)`
Veo 3.1 Générer preview `(veo-3.1-generate-preview)`
Générer rapidement avec Veo 3.1 preview `(veo-3.1-fast-generate-preview)`
Veo 3.1 Générer `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription `(chirp_3)`
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Aperçu de Gemini 2.5 Flash Lite TTS preview `(gemini-2.5-flash-lite-preview-tts)`

Emplacements des points de terminaison des modèles de partenairesGoogle Cloud

Google traite les demandes depuis la région que vous avez spécifiée. Pour certains modèles, Google propose également un point de terminaison mondial afin d'améliorer la disponibilité globale et de réduire les taux d'erreur. Le point de terminaison mondial peut avoir un ensemble de quotas distinct de celui du point de terminaison régional et n'est pas compatible avec les exigences de résidence des données. Pour en savoir plus, consultez la section "Points de terminaison régionaux et mondiaux" dans Modèles partenaires Vertex AI pour MaaS.

Les points de terminaison des modèles de partenaires pour l'IA générative sur Vertex AI sont disponibles dans les régions suivantes :

Monde

	Global(global)
Modèles Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

États-Unis

	Oregon(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Caroline du Sud(us-east1)	N. Virginie(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modèles Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Amériques

	Montréal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modèles Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europe

	Londres(europe-west2)	Belgique(europe-west1)	Pays-Bas(europe-west4)	Zurich(europe-west6)	Francfort(europe-west3)	Finlande(europe-north1)	Varsovie(europe-central2)	Milan(europe-west8)	Madrid(europe-southwest1)	Paris(europe-west9)
Modèles Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asie-Pacifique

	Mumbai(asia-south1)	Singapour(asia-southeast1)	Hong Kong(asia-east2)	Taïwan(asia-east1)	Tokyo(asia-northeast1)	Sydney(australia-southeast1)	Séoul(asia-northeast3)
Modèles Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Moyen-Orient

	Tel-Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modèles Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Emplacements des points de terminaison des modèles ouvertsGoogle Cloud

Les points de terminaison des modèles ouverts pour l'IA générative sur Vertex AI sont disponibles dans les régions suivantes :

Monde

	Global(global)
Modèles Deepseek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modèles ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modèles OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modèles Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modèles Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modèles e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

États-Unis

	Oregon(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Caroline du Sud(us-east1)	N. Virginie(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modèles Deepseek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modèles ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modèles OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modèles Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modèles Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modèles e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Amériques

	Montréal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modèles Deepseek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modèles ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modèles OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modèles Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modèles Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modèles e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Europe

	Londres(europe-west2)	Belgique(europe-west1)	Pays-Bas(europe-west4)	Zurich(europe-west6)	Francfort(europe-west3)	Finlande(europe-north1)	Varsovie(europe-central2)	Milan(europe-west8)	Madrid(europe-southwest1)	Paris(europe-west9)
Modèles Deepseek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modèles ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modèles OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modèles Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modèles Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modèles e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Asie-Pacifique

	Mumbai(asia-south1)	Singapour(asia-southeast1)	Hong Kong(asia-east2)	Taïwan(asia-east1)	Tokyo(asia-northeast1)	Sydney(australia-southeast1)	Séoul(asia-northeast3)
Modèles Deepseek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modèles ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modèles OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modèles Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modèles Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modèles e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Moyen-Orient

	Tel-Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modèles Deepseek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modèles ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modèles OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modèles Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modèles Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modèles e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
Multilingual E5 Large `(multilingual-e5-large-instruct-maas)`

Étapes suivantes

En savoir plus sur la résidence des données pour l'IA générative sur Vertex AI.
En savoir plus sur les régionsGoogle Cloud .
En savoir plus sur les contrôles de sécurité par fonctionnalité.
Découvrez les modèles compatibles avec l'IA générative sur Vertex AI. Consultez la documentation de référence sur les modèles de fondation de l'IA générative.
Découvrez les emplacements de Vertex AI.

Déploiements et points de terminaison Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Point de terminaison global

Modèles compatibles

Utiliser le point de terminaison global

Limites

Cliquez pour afficher les modèles compatibles avec le point de terminaison mondial lorsque vous utilisez le débit provisionné.

Emplacements des points de terminaison des modèles Google

Monde

États-Unis

Amériques

Europe

Asie-Pacifique

Moyen-Orient

Emplacements des points de terminaison des modèles de partenairesGoogle Cloud

Monde

États-Unis

Amériques

Europe

Asie-Pacifique

Moyen-Orient

Emplacements des points de terminaison des modèles ouvertsGoogle Cloud

Monde

États-Unis

Amériques

Europe

Asie-Pacifique

Moyen-Orient

Étapes suivantes

Déploiements et points de terminaison