Les modèles Google et des partenaires, ainsi que les fonctionnalités d'IA générative sur Vertex AI, sont exposés sous la forme de points de terminaison régionaux spécifiques et d'un point de terminaison global. Les points de terminaison globaux couvrent le monde entier et offrent une disponibilité et une fiabilité supérieures à celles des régions uniques.
Point de terminaison global
La sélection d'un point de terminaison global pour vos requêtes peut améliorer la disponibilité générale tout en réduisant les erreurs d'épuisement des ressources (429). N'utilisez pas le point de terminaison global si vous avez des exigences en termes de traitement ML, car vous ne pouvez pas contrôler ni savoir à quelle région vos requêtes de traitement ML sont envoyées lorsqu'une requête est effectuée.
Modèles compatibles
L'utilisation du point de terminaison global est compatible avec les modèles Google suivants dans les régions spécifiées. Pour savoir quelles régions sont compatibles avec le point de terminaison mondial, consultez l'onglet Global dans le tableau des emplacements des points de terminaison des modèles Google.
- Gemini 3 Pro (preview)
- Image Gemini 3 Pro (preview)
- Gemini 2.5 Pro
- Gemini 2.5 Flash (preview)
- Gemini 2.5 Flash-Lite (preview)
- Gemini 2.5 Flash Image
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.0 Flash avec génération d'images (Preview)
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Pour en savoir plus sur la disponibilité mondiale des points de terminaison pour les modèles partenaires, consultez l'onglet Global dans le tableau des emplacements des points de terminaison des modèles partenaires.Google Cloud
Utiliser le point de terminaison global
Pour utiliser le point de terminaison global, excluez l'emplacement du nom du point de terminaison et configurez l'emplacement de la ressource sur global. Voici un exemple d'URL de point de terminaison global :
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Pour le SDK Google Gen AI, créez un client qui utilise l'emplacement global :
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Pour le SDK Vertex AI pour Python, initialisez le SDK à l'aide de l'emplacement global :
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limites
Les fonctionnalités suivantes ne sont pas disponibles lorsque vous utilisez le point de terminaison global :
- Réglage
- Prédiction par lot pour les modèles Anthropic et OpenMaaS
- Corpus de génération augmentée par récupération (RAG) (les requêtes RAG sont acceptées)
L'utilisation du point de terminaison global avec le débit provisionné n'est disponible que pour les modèles suivants :
| Modèle | Dernière version du modèle compatible |
|---|---|
| Gemini 3 Pro (preview) | gemini-3-pro-preview |
| Image Gemini 3 Pro (preview) | gemini-3-pro-image-preview |
| Gemini 2.5 Pro | gemini-2.5-pro |
| Gemini 2.5 Flash (preview) | gemini-2.5-flash-preview-09-2025 |
| Gemini 2.5 Flash-Lite (preview) | gemini-2.5-flash-lite-preview-09-2025 |
| Gemini 2.5 Flash Image | gemini-2.5-flash-image |
| Gemini 2.0 Flash | gemini-2.5-flash |
| Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
| Gemini 2.0 Flash | gemini-2.0-flash-001 |
| Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Emplacements des points de terminaison des modèles Google
Des points de terminaison des modèles Google pour l'IA générative sur Vertex AI sont disponibles dans les régions suivantes.
États-Unis
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Caroline du Sud (us-east1) | Virginie du Nord (us-east4) | Oregon (us-west1) | |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||||||
| Image Gemini 3 Pro ( gemini-3-pro-image-preview) |
|||||||
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||||||
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio) |
|||||||
| Image Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||||||
| Gemini Embeddings ( gemini-embedding-001) |
|||||||
| Embeddings pour le texte | |||||||
| Embeddings multimodaux | |||||||
| Imagen ( imagegeneration@002) |
|||||||
| Imagen 2 ( imagegeneration@005) |
|||||||
| Imagen 2 ( imagegeneration@006) |
|||||||
| Imagen 3 ( imagen-3.0-generate-001) |
|||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||||||
| Modification et personnalisation Imagen 3 ( imagen-3.0-capability-001) |
|||||||
| Imagen 3 ( imagen-3.0-generate-002) |
|||||||
| Imagen 4
( imagen-4.0-generate-001) |
|||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||||||
| Génération expérimentale Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|||||||
| Veo 2
( veo-2.0-generate-001) |
|||||||
| Veo 3
( veo-3.0-generate-001) |
|||||||
| Veo 3 Fast
( veo-3.0-fast-generate-001) |
|||||||
| Veo 3 (preview)
( veo-3.0-generate-preview) |
|||||||
| Veo 3 Fast (preview)
( veo-3.0-fast-generate-preview) |
|||||||
| Veo 3.1
( veo-3.1-generate-001) |
|||||||
| Veo 3.1 Fast
( veo-3.1-fast-generate-001) |
|||||||
| Veo 3.1 (preview)
( veo-3.1-generate-preview) |
|||||||
| Veo 3.1 Fast (preview)
( veo-3.1-fast-generate-preview) |
|||||||
Chirp 3 : Transcription (chirp_3) |
|||||||
Chirp 2 : Transcription (chirp_2) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|||||||
| Chirp 3 : Voix HD | |||||||
| Chirp 3 : voix personnalisée instantanée |
Canada
| Montréal (northamerica-northeast1) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Image Gemini 3 Pro ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Image Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Gemini Embeddings ( gemini-embedding-001) |
|
| Embeddings pour le texte | |
| Embeddings multimodaux | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Modification et personnalisation Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Génération expérimentale Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|
Chirp 3 : Transcription (chirp_3) |
|
Chirp 2 : Transcription (chirp_2) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|
| Chirp 3 : Voix HD | |
| Chirp 3 : voix personnalisée instantanée |
Amérique du Sud
| São Paulo, Brésil (southamerica-east1) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Image Gemini 3 Pro ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Image Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Gemini Embeddings ( gemini-embedding-001) |
|
| Embeddings pour le texte | |
| Embeddings multimodaux | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Modification et personnalisation Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Génération expérimentale Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|
Chirp 3 : Transcription (chirp_3) |
|
Chirp 2 : Transcription (chirp_2) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|
| Chirp 3 : Voix HD | |
| Chirp 3 : voix personnalisée instantanée |
Europe
| Pays-Bas (europe-west4) | Paris, France (europe-west9) | Londres, Royaume-Uni (europe-west2) | Francfort, Allemagne (europe-west3) | Belgique (europe-west1) | Zurich, Suisse (europe-west6) | Madrid, Espagne (europe-southwest1) | Milan, Italie (europe-west8) | Finlande (europe-north1) | Varsovie, Pologne (europe-central2) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
||||||||||
| Image Gemini 3 Pro ( gemini-3-pro-image-preview) |
||||||||||
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
||||||||||
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio) |
||||||||||
| Image Gemini 2.5 Flash ( gemini-2.5-flash-image) |
||||||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
||||||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
||||||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
||||||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
||||||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
||||||||||
| Gemini Embeddings ( gemini-embedding-001) |
||||||||||
| Embeddings pour le texte | ||||||||||
| Embeddings multimodaux | ||||||||||
| Imagen ( imagegeneration@002) |
||||||||||
| Imagen 2 ( imagegeneration@005) |
||||||||||
| Imagen 2 ( imagegeneration@006) |
||||||||||
| Imagen 3 ( imagen-3.0-generate-001) |
||||||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
||||||||||
| Modification et personnalisation Imagen 3 ( imagen-3.0-capability-001) |
||||||||||
| Imagen 3 ( imagen-3.0-generate-002) |
||||||||||
| Imagen 4
( imagen-4.0-generate-001) |
||||||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
||||||||||
| Génération expérimentale Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
||||||||||
Chirp 3 : Transcription (chirp_3) |
||||||||||
Chirp 2 : Transcription (chirp_2) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
||||||||||
| Chirp 3 : Voix HD | ||||||||||
| Chirp 3 : voix personnalisée instantanée |
Asie-Pacifique
| Tokyo, Japon (asia-northeast1) | Sydney, Australie (australia-southeast1) | Singapour (asia-southeast1) | Séoul, Corée (asia-northeast3) | Taïwan (asia-east1) | Hong Kong, Chine (asia-east2) | Mumbai, Inde (asia-south1) | |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||||||
| Image Gemini 3 Pro ( gemini-3-pro-image-preview) |
|||||||
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||||||
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio) |
|||||||
| Image Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||||||
| Gemini Embeddings ( gemini-embedding-001) |
|||||||
| Embeddings pour le texte | |||||||
| Embeddings multimodaux | |||||||
| Imagen ( imagegeneration@002) |
|||||||
| Imagen 2 ( imagegeneration@005) |
|||||||
| Imagen 2 ( imagegeneration@006) |
|||||||
| Imagen 3 ( imagen-3.0-generate-001) |
|||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||||||
| Modification et personnalisation Imagen 3 ( imagen-3.0-capability-001) |
|||||||
| Imagen 3 ( imagen-3.0-generate-002) |
|||||||
| Imagen 4
( imagen-4.0-generate-001) |
|||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||||||
| Génération expérimentale Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|||||||
Chirp 3 : Transcription (chirp_3) |
|||||||
Chirp 2 : Transcription (chirp_2) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|||||||
| Chirp 3 : Voix HD | |||||||
| Chirp 3 : voix personnalisée instantanée |
Moyen-Orient
| Dammam, Arabie saoudite (me-central2) | Doha, Qatar (me-central1) | Tel Aviv, Israël (me-west1) | |
|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||
| Image Gemini 3 Pro ( gemini-3-pro-image-preview) |
|||
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio) |
|||
| Image Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||
| Gemini Embeddings ( gemini-embedding-001) |
|||
| Embeddings pour le texte | |||
| Embeddings multimodaux | |||
| Imagen ( imagegeneration@002) |
|||
| Imagen 2 ( imagegeneration@005) |
|||
| Imagen 2 ( imagegeneration@006) |
|||
| Imagen 3 ( imagen-3.0-generate-001) |
|||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||
| Modification et personnalisation Imagen 3 ( imagen-3.0-capability-001) |
|||
| Imagen 3 ( imagen-3.0-generate-002) |
|||
| Imagen 4
( imagen-4.0-generate-001) |
|||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||
| Génération expérimentale Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|||
Chirp 3 : Transcription (chirp_3) |
|||
Chirp 2 : Transcription (chirp_2) |
|||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|||
| Chirp 3 : Voix HD | |||
| Chirp 3 : voix personnalisée instantanée |
Monde
| Global (monde) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Image Gemini 3 Pro ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash avec audio natif de l'API Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Image Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Gemini Embeddings ( gemini-embedding-001) |
|
| Embeddings pour le texte | |
| Embeddings multimodaux | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Modification et personnalisation Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Génération expérimentale Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|
Chirp 3 : Transcription (chirp_3) |
|
Chirp 2 : Transcription (chirp_2) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|
| Chirp 3 : Voix HD | |
| Chirp 3 : voix personnalisée instantanée |
Emplacements des points de terminaison des modèles de partenairesGoogle Cloud
Google traite les demandes depuis la région que vous avez spécifiée. Pour certains modèles, Google propose également un point de terminaison mondial afin d'améliorer la disponibilité globale et de réduire les taux d'erreur. Le point de terminaison mondial peut avoir un ensemble de quotas distinct de celui du point de terminaison régional et n'est pas compatible avec les exigences de résidence des données. Pour en savoir plus, consultez la section "Points de terminaison régionaux et mondiaux" dans Modèles partenaires Vertex AI pour MaaS.
Les points de terminaison des modèles de partenaires pour l'IA générative sur Vertex AI sont disponibles dans les régions suivantes :
États-Unis
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Caroline du Sud (us-east1) | Virginie du Nord (us-east4) | Oregon (us-west1) | |
|---|---|---|---|---|---|---|---|
| Claude 4.5 Opus d'Anthropic | |||||||
| Claude Sonnet 4.5 d'Anthropic | |||||||
| Claude 4.1 Opus d'Anthropic | |||||||
| Claude Haiku 4.5 d'Anthropic | |||||||
| Claude Opus 4 d'Anthropic | |||||||
| Claude Sonnet 4 d'Anthropic | |||||||
| Claude 3.7 Sonnet d'Anthropic (obsolète) | |||||||
| Claude 3.5 Haiku d'Anthropic | |||||||
| Claude 3 Haiku d'Anthropic | |||||||
| Mistral Medium 3 | |||||||
| Mistral OCR (25.05) | |||||||
| Mistral Small 3.1 (25.03) | |||||||
| Mistral Large (24.07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) |
Europe
| Pays-Bas (europe-west4) | Belgique (europe-west1) | |
|---|---|---|
| Claude 4.5 Opus d'Anthropic | ||
| Claude Sonnet 4.5 d'Anthropic | ||
| Claude 4.1 Opus d'Anthropic | ||
| Claude Haiku 4.5 | ||
| Claude Opus 4 d'Anthropic | ||
| Claude Sonnet 4 d'Anthropic | ||
| Claude 3.7 Sonnet d'Anthropic (obsolète) | ||
| Claude 3.5 Haiku d'Anthropic | ||
| Claude 3 Haiku d'Anthropic | ||
| Mistral Medium 3 | ||
| Mistral OCR (25.05) | ||
| Mistral Small 3.1 (25.03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Asie-Pacifique
| Singapour (asia-southeast1) | Taïwan (asia-east1) | |
|---|---|---|
| Claude 4.5 Opus d'Anthropic | ||
| Claude Sonnet 4.5 d'Anthropic | ||
| Claude 4.1 Opus d'Anthropic | ||
| Claude Haiku 4.5 d'Anthropic | ||
| Claude Opus 4 d'Anthropic | ||
| Claude Sonnet 4 d'Anthropic | ||
| Claude 3.7 Sonnet d'Anthropic (obsolète) | ||
| Claude 3.5 Haiku d'Anthropic | ||
| Claude 3 Haiku d'Anthropic | ||
| Mistral Medium 3 | ||
| Mistral OCR (25.05) | ||
| Mistral Small 3.1 (25.03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Monde
| Global (monde) | ||
|---|---|---|
| Claude 4.5 Opus d'Anthropic | ||
| Claude Sonnet 4.5 d'Anthropic | ||
| Claude 4.1 Opus d'Anthropic | ||
| Claude Haiku 4.5 d'Anthropic | ||
| Claude Opus 4 d'Anthropic | ||
| Claude Sonnet 4 d'Anthropic | ||
| Claude 3.7 Sonnet d'Anthropic (obsolète) | ||
| Claude 3.5 Haiku d'Anthropic | ||
| Claude 3 Haiku d'Anthropic | ||
| Mistral Medium 3 | ||
| Mistral OCR (25.05) | ||
| Mistral Small 3.1 (25.03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Emplacements des points de terminaison des modèles ouvertsGoogle Cloud
Google traite les demandes depuis la région que vous avez spécifiée. Pour certains modèles, Google propose également un point de terminaison mondial afin d'améliorer la disponibilité globale et de réduire les taux d'erreur. Le point de terminaison mondial peut avoir un ensemble de quotas distinct de celui du point de terminaison régional et n'est pas compatible avec les exigences de résidence des données. Pour en savoir plus, consultez la section "Points de terminaison régionaux et mondiaux" dans Modèles ouverts Vertex AI pour MaaS.
Les points de terminaison des modèles ouverts pour l'IA générative sur Vertex AI sont disponibles dans les régions suivantes :
États-Unis
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Caroline du Sud (us-east1) | Virginie du Nord (us-east4) | Oregon (us-west1) | |
|---|---|---|---|---|---|---|---|
| DeepSeek R1 (0528) | |||||||
| DeepSeek-OCR | |||||||
| DeepSeek-V3.1 | |||||||
| gpt-oss 120B | |||||||
| gpt-oss 20B | |||||||
| Kimi K2 Thinking | |||||||
| Llama 3.1 8B (Preview) | |||||||
| Llama 3.1 70B (Preview) | |||||||
| Llama 3.1 405B | |||||||
| Llama 3.2 90B (Preview) | |||||||
| Llama 3.3 70B (Preview) | |||||||
| Llama 4 Maverick 17B-128E (Preview) | |||||||
| Llama 4 Scout 17B-16E (Preview) | |||||||
| MiniMax M2 | |||||||
| Multilingual E5 Large | |||||||
| Multilingual E5-Small | |||||||
| Qwen3 235B | |||||||
| Qwen3 Coder | |||||||
| Qwen3-Next-80B Instruct | |||||||
| Qwen3-Next-80B Thinking |
Europe
| Pays-Bas (europe-west4) | Belgique (europe-west1) | |
|---|---|---|
| DeepSeek R1 (0528) | ||
| DeepSeek-OCR | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi K2 Thinking | ||
| Llama 3.1 8B (Preview) | ||
| Llama 3.1 70B (Preview) | ||
| Llama 3.1 405B | ||
| Llama 3.2 90B (Preview) | ||
| Llama 3.3 70B (Preview) | ||
| Llama 4 Maverick 17B-128E (Preview) | ||
| Llama 4 Scout 17B-16E (Preview) | ||
| MiniMax M2 | ||
| Multilingual E5 Large | ||
| Multilingual E5-Small | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
Asie-Pacifique
| Singapour (asia-southeast1) | Taïwan (asia-east1) | |
|---|---|---|
| DeepSeek R1 (0528) | ||
| DeepSeek-OCR | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi K2 Thinking | ||
| Llama 3.1 8B (Preview) | ||
| Llama 3.1 70B (Preview) | ||
| Llama 3.1 405B | ||
| Llama 3.2 90B (Preview) | ||
| Llama 3.3 70B (Preview) | ||
| Llama 4 Maverick 17B-128E (Preview) | ||
| Llama 4 Scout 17B-16E (Preview) | ||
| MiniMax M2 | ||
| Multilingual E5 Large | ||
| Multilingual E5-Small | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
Monde
| Global (monde) | |
|---|---|
| DeepSeek R1 (0528) | |
| DeepSeek-OCR | |
| DeepSeek-V3.1 | |
| gpt-oss 120B | |
| gpt-oss 20B | |
| Kimi K2 Thinking | |
| Llama 3.1 8B (Preview) | |
| Llama 3.1 70B (Preview) | |
| Llama 3.1 405B | |
| Llama 3.2 90B (Preview) | |
| Llama 3.3 70B (Preview) | |
| Llama 4 Maverick 17B-128E (Preview) | |
| Llama 4 Scout 17B-16E (Preview) | |
| MiniMax M2 | |
| Multilingual E5 Large | |
| Multilingual E5-Small | |
| Qwen3 235B | |
| Qwen3 Coder | |
| Qwen3-Next-80B Instruct | |
| Qwen3-Next-80B Thinking |
Étapes suivantes
- Pour suivre un tutoriel basé sur un notebook qui présente le point de terminaison global, consultez Présentation du point de terminaison global Vertex AI.
- En savoir plus sur la résidence des données pour l'IA générative sur Vertex AI.
- En savoir plus sur les régionsGoogle Cloud .
- En savoir plus sur les contrôles de sécurité par fonctionnalité.
- Découvrez les modèles compatibles avec l'IA générative sur Vertex AI. Consultez la documentation de référence sur les modèles de fondation de l'IA générative.
- Découvrez les emplacements de Vertex AI.