Déploiements et points de terminaison

Les modèles Google et partenaires, ainsi que les fonctionnalités d'IA générative sur Gemini Enterprise Agent Platform, sont exposés sous la forme de points de terminaison régionaux spécifiques et d'un point de terminaison global. Les points de terminaison globaux couvrent le monde entier et offrent une disponibilité et une fiabilité supérieures à celles des régions uniques.

Spécifier un point de terminaison

Pour les points de terminaison régionaux standards (tels que us-central) et le point de terminaison mondial :

Python

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='GOOGLE_CLOUD_PROJECT', location='GOOGLE_CLOUD_LOCATION')

Python

client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION"
MODEL_ID="MODEL_ID"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://${GOOGLE_CLOUD_LOCATION}$-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words."
      }
    }
  }'

Points de terminaison multirégionaux

Les points de terminaison multirégionaux vous permettent de vous assurer que le traitement de machine learning des données client par le service reste dans une limite juridictionnelle spécifique, comme les États-Unis ou l'Union européenne.

Le tableau suivant liste les noms d'hôte pour les points de terminaison multirégionaux :

Emplacement multirégional Emplacement Nom d'hôte
États-Unis us https://aiplatform.us.rep.googleapis.com
Union européenne eu https://aiplatform.eu.rep.googleapis.com

Python

import vertexai
from google.adk.agents import Agent

# Set the multi-region location on the client
client = vertexai.Client(
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

# The agent will use this configuration
agent = Agent(
    model="gemini-2.5-flash",
    name='my_agent'
)

Python

from google import genai

# location must be set to 'us' or 'eu' for multi-region routing
client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
MODEL_ID="MODEL_ID"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION" # Must be 'us' or 'eu'
# Explicitly use the .rep. hostname for multi-region endpoints
API_ENDPOINT="https://aiplatform.${GOOGLE_CLOUD_LOCATION}.rep.googleapis.com"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "${API_ENDPOINT}/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words"
      }
    }
  }'

Point de terminaison global

La sélection d'un point de terminaison global pour vos requêtes peut améliorer la disponibilité générale tout en réduisant les erreurs d'épuisement des ressources (429). N'utilisez pas le point de terminaison global si vous avez des exigences en termes de traitement ML, car vous ne pouvez pas contrôler ni savoir à quelle région vos requêtes de traitement ML sont envoyées lorsqu'une requête est effectuée.

Modèles compatibles

L'utilisation du point de terminaison global est compatible avec les modèles Google suivants dans les régions spécifiées. Pour savoir quels modèles sont compatibles avec le point de terminaison mondial, consultez l'onglet Global dans le tableau des emplacements des points de terminaison des modèles Google.

Pour en savoir plus sur la disponibilité mondiale des points de terminaison pour les modèles partenaires, consultez l'onglet Global dans le tableau des emplacements des points de terminaison des modèles partenaires.Google Cloud

Limites

Les fonctionnalités suivantes ne sont pas disponibles lorsque vous utilisez le point de terminaison global :

  • Réglage
  • Prédiction par lot pour les modèles Anthropic et OpenMaaS
  • Corpus de génération augmentée par récupération (RAG) (les requêtes RAG sont acceptées)

L'utilisation du point de terminaison global avec le débit provisionné n'est disponible que pour les modèles suivants :

Cliquez pour afficher les modèles compatibles avec le point de terminaison mondial lorsque vous utilisez le débit provisionné.

Modèle Dernière version de modèle compatible
Gemini 3.5 Flash gemini-3.5-flash
Gemini 3.1 Flash-Lite gemini-3.1-flash-lite
Image Gemini 3.1 Flash preview gemini-3.1-flash-image-preview
Gemini 3.1 Pro preview gemini-3.1-pro-preview
Gemini 3 Flash preview gemini-3-flash-preview
Image Gemini 3 Pro preview gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash preview gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite preview gemini-2.5-flash-lite-preview-09-2025
Image Gemini 2.5 Flash gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite

Emplacements des points de terminaison des modèles Google

Les modèles Google de Gemini Enterprise Agent Platform sont disponibles pour les points de terminaison suivants :

Monde

Global(global)
Modèles Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Image Gemini 3.1 Flash preview (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro preview (gemini-3.1-pro-preview)
Gemini 3 Flash preview (gemini-3-flash-preview)
Image Gemini 3 Pro preview (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash preview (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite preview (gemini-2.5-flash-lite-preview-09-2025)
Image Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash avec l'API Gemini Live preview (gemini-2.0-flash-live-preview-04-09)
Modèles d'embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Veo sur les modèles Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate aperçu (veo-2.0-generate-exp)
Veo 2 Generate aperçu (veo-2.0-generate-preview)
Veo 3 Generate preview (veo-3.0-generate-preview)
Veo 3 Generate preview (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Générer Aperçu (veo-3.1-generate-preview)
Génération rapide Veo 3.1 preview (veo-3.1-fast-generate-preview)
Veo 3.1 Générer (veo-3.1-generate-001)
Génération rapide Veo 3.1 (veo-3.1-fast-generate-001)
Générer des vidéos Veo 3.1 Lite Aperçu (veo-3.1-lite-generate-001)
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription (chirp_3)
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Aperçu de Gemini 2.5 Flash-Lite TTS aperçu (gemini-2.5-flash-lite-preview-tts)

Emplacement multirégional

États-Unis (multirégional)(us) Union européenne (multirégionale)(eu)
Modèles Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Image Gemini 3.1 Flash preview (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro preview (gemini-3.1-pro-preview)
Gemini 3 Flash preview (gemini-3-flash-preview)
Image Gemini 3 Pro preview (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash preview (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite preview (gemini-2.5-flash-lite-preview-09-2025)
Image Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash avec l'API Gemini Live preview (gemini-2.0-flash-live-preview-04-09)
Modèles d'embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Veo sur les modèles Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate aperçu (veo-2.0-generate-exp)
Veo 2 Generate aperçu (veo-2.0-generate-preview)
Veo 3 Generate preview (veo-3.0-generate-preview)
Veo 3 Generate preview (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Générer Aperçu (veo-3.1-generate-preview)
Génération rapide Veo 3.1 preview (veo-3.1-fast-generate-preview)
Veo 3.1 Générer (veo-3.1-generate-001)
Génération rapide Veo 3.1 (veo-3.1-fast-generate-001)
Générer des vidéos Veo 3.1 Lite Aperçu (veo-3.1-lite-generate-001)
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription (chirp_3)
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Aperçu de Gemini 2.5 Flash-Lite TTS aperçu (gemini-2.5-flash-lite-preview-tts)

États-Unis

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Caroline du Sud(us-east1) N. Virginie(us-east4) Columbus(us-east5) Dallas(us-south1)
Modèles Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Image Gemini 3.1 Flash preview (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro preview (gemini-3.1-pro-preview)
Gemini 3 Flash preview (gemini-3-flash-preview)
Image Gemini 3 Pro preview (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash preview (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite preview (gemini-2.5-flash-lite-preview-09-2025)
Image Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash avec l'API Gemini Live preview (gemini-2.0-flash-live-preview-04-09)
Modèles d'embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Veo sur les modèles Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate aperçu (veo-2.0-generate-exp)
Veo 2 Generate aperçu (veo-2.0-generate-preview)
Veo 3 Generate preview (veo-3.0-generate-preview)
Veo 3 Generate preview (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Générer Aperçu (veo-3.1-generate-preview)
Génération rapide Veo 3.1 preview (veo-3.1-fast-generate-preview)
Veo 3.1 Générer (veo-3.1-generate-001)
Génération rapide Veo 3.1 (veo-3.1-fast-generate-001)
Générer des vidéos Veo 3.1 Lite Aperçu (veo-3.1-lite-generate-001)
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription (chirp_3)
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Aperçu de Gemini 2.5 Flash-Lite TTS aperçu (gemini-2.5-flash-lite-preview-tts)

Amériques

Montréal(northamerica-northeast1) São Paulo(southamerica-east1)
Modèles Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Image Gemini 3.1 Flash preview (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro preview (gemini-3.1-pro-preview)
Gemini 3 Flash preview (gemini-3-flash-preview)
Image Gemini 3 Pro preview (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash preview (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite preview (gemini-2.5-flash-lite-preview-09-2025)
Image Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash avec l'API Gemini Live preview (gemini-2.0-flash-live-preview-04-09)
Modèles d'embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Veo sur les modèles Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate aperçu (veo-2.0-generate-exp)
Veo 2 Generate aperçu (veo-2.0-generate-preview)
Veo 3 Generate preview (veo-3.0-generate-preview)
Veo 3 Generate preview (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Générer Aperçu (veo-3.1-generate-preview)
Génération rapide Veo 3.1 preview (veo-3.1-fast-generate-preview)
Veo 3.1 Générer (veo-3.1-generate-001)
Génération rapide Veo 3.1 (veo-3.1-fast-generate-001)
Générer des vidéos Veo 3.1 Lite Aperçu (veo-3.1-lite-generate-001)
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription (chirp_3)
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Aperçu de Gemini 2.5 Flash-Lite TTS aperçu (gemini-2.5-flash-lite-preview-tts)

Europe

Londres(europe-west2) Belgique(europe-west1) Pays-Bas(europe-west4) Zurich(europe-west6) Francfort(europe-west3) Finlande(europe-north1) Varsovie(europe-central2) Milan(europe-west8) Madrid(europe-southwest1) Paris(europe-west9)
Modèles Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Image Gemini 3.1 Flash preview (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro preview (gemini-3.1-pro-preview)
Gemini 3 Flash preview (gemini-3-flash-preview)
Image Gemini 3 Pro preview (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash preview (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite preview (gemini-2.5-flash-lite-preview-09-2025)
Image Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash avec l'API Gemini Live preview (gemini-2.0-flash-live-preview-04-09)
Modèles d'embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Veo sur les modèles Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate aperçu (veo-2.0-generate-exp)
Veo 2 Generate aperçu (veo-2.0-generate-preview)
Veo 3 Generate preview (veo-3.0-generate-preview)
Veo 3 Generate preview (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Générer Aperçu (veo-3.1-generate-preview)
Génération rapide Veo 3.1 preview (veo-3.1-fast-generate-preview)
Veo 3.1 Générer (veo-3.1-generate-001)
Génération rapide Veo 3.1 (veo-3.1-fast-generate-001)
Générer des vidéos Veo 3.1 Lite Aperçu (veo-3.1-lite-generate-001)
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription (chirp_3)
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Aperçu de Gemini 2.5 Flash-Lite TTS aperçu (gemini-2.5-flash-lite-preview-tts)

Asie-Pacifique

Mumbai(asia-south1) Singapour(asia-southeast1) Hong Kong(asia-east2) Taïwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Séoul(asia-northeast3)
Modèles Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Image Gemini 3.1 Flash preview (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro preview (gemini-3.1-pro-preview)
Gemini 3 Flash preview (gemini-3-flash-preview)
Image Gemini 3 Pro preview (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash preview (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite preview (gemini-2.5-flash-lite-preview-09-2025)
Image Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash avec l'API Gemini Live preview (gemini-2.0-flash-live-preview-04-09)
Modèles d'embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Veo sur les modèles Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate aperçu (veo-2.0-generate-exp)
Veo 2 Generate aperçu (veo-2.0-generate-preview)
Veo 3 Generate preview (veo-3.0-generate-preview)
Veo 3 Generate preview (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Générer Aperçu (veo-3.1-generate-preview)
Génération rapide Veo 3.1 preview (veo-3.1-fast-generate-preview)
Veo 3.1 Générer (veo-3.1-generate-001)
Génération rapide Veo 3.1 (veo-3.1-fast-generate-001)
Générer des vidéos Veo 3.1 Lite Aperçu (veo-3.1-lite-generate-001)
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription (chirp_3)
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Aperçu de Gemini 2.5 Flash-Lite TTS aperçu (gemini-2.5-flash-lite-preview-tts)

Moyen-Orient

Tel-Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modèles Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Image Gemini 3.1 Flash preview (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro preview (gemini-3.1-pro-preview)
Gemini 3 Flash preview (gemini-3-flash-preview)
Image Gemini 3 Pro preview (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash preview (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite preview (gemini-2.5-flash-lite-preview-09-2025)
Image Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash avec l'audio natif de l'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash avec l'API Gemini Live preview (gemini-2.0-flash-live-preview-04-09)
Modèles d'embeddings
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings pour le texte
Embeddings multimodaux
Veo sur les modèles Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate aperçu (veo-2.0-generate-exp)
Veo 2 Generate aperçu (veo-2.0-generate-preview)
Veo 3 Generate preview (veo-3.0-generate-preview)
Veo 3 Generate preview (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Générer Aperçu (veo-3.1-generate-preview)
Génération rapide Veo 3.1 preview (veo-3.1-fast-generate-preview)
Veo 3.1 Générer (veo-3.1-generate-001)
Génération rapide Veo 3.1 (veo-3.1-fast-generate-001)
Générer des vidéos Veo 3.1 Lite Aperçu (veo-3.1-lite-generate-001)
Modèles Speech-to-Text et Text-to-Speech
Chirp 3 : Transcription (chirp_3)
Chirp 3 : Voix HD
Chirp 3 : Voix personnalisée instantanée
Chirp 2 : Transcription (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Aperçu de Gemini 2.5 Flash-Lite TTS aperçu (gemini-2.5-flash-lite-preview-tts)

Emplacements des points de terminaison des modèles de partenairesGoogle Cloud

Google traite les demandes depuis la région que vous avez spécifiée. Pour certains modèles, Google propose également un point de terminaison mondial afin d'améliorer la disponibilité globale et de réduire les taux d'erreur. Le point de terminaison mondial peut avoir un ensemble de quotas distinct de celui du point de terminaison régional et n'est pas compatible avec les exigences de résidence des données. Pour en savoir plus, consultez la section "Point de terminaison régional et mondial" dans Modèles partenaires Gemini Enterprise Agent Platform pour MaaS.

Les points de terminaison des modèles de partenaires pour Agent Platform sont disponibles dans les régions suivantes :

Monde

Global(global)
Modèles Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic (obsolète)
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Emplacement multirégional

États-Unis (multirégional)(us) Union européenne (multirégionale)(eu)
Modèles Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic (obsolète)
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

États-Unis

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Caroline du Sud(us-east1) N. Virginie(us-east4) Columbus(us-east5) Dallas(us-south1)
Modèles Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic (obsolète)
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Amériques

Montréal(northamerica-northeast1) São Paulo(southamerica-east1)
Modèles Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic (obsolète)
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europe

Londres(europe-west2) Belgique(europe-west1) Pays-Bas(europe-west4) Zurich(europe-west6) Francfort(europe-west3) Finlande(europe-north1) Varsovie(europe-central2) Milan(europe-west8) Madrid(europe-southwest1) Paris(europe-west9)
Modèles Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic (obsolète)
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asie-Pacifique

Mumbai(asia-south1) Singapour(asia-southeast1) Hong Kong(asia-east2) Taïwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Séoul(asia-northeast3)
Modèles Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic (obsolète)
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Moyen-Orient

Tel-Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modèles Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet d'Anthropic
Claude 3.5 Haiku d'Anthropic
Claude 3 Haiku d'Anthropic (obsolète)
Modèles Mistral
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Emplacements des points de terminaison des modèles ouvertsGoogle Cloud

Google traite les demandes depuis la région que vous avez spécifiée. Pour certains modèles, Google propose également un point de terminaison mondial afin d'améliorer la disponibilité globale et de réduire les taux d'erreur. Le point de terminaison mondial peut avoir un ensemble de quotas distinct de celui du point de terminaison régional et n'est pas compatible avec les exigences de résidence des données. Pour en savoir plus, consultez la section "Point de terminaison régional et mondial" dans Modèles ouverts de la plate-forme d'agents Gemini Enterprise pour le MaaS.

Les points de terminaison de modèle ouvert pour Agent Platform sont disponibles dans les régions suivantes :

Monde

Global(global)
Modèles Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modèles ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modèles OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modèles Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 (minimax-m2-maas)
Modèles Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modèles e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5-Large (multilingual-e5-large-instruct-maas)

Emplacement multirégional

États-Unis (multirégional)(us) Union européenne (multirégionale)(eu)
Modèles Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modèles ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modèles OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modèles Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 (minimax-m2-maas)
Modèles Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modèles e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5-Large (multilingual-e5-large-instruct-maas)

États-Unis

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Caroline du Sud(us-east1) N. Virginie(us-east4) Columbus(us-east5) Dallas(us-south1)
Modèles Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modèles ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modèles OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modèles Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 (minimax-m2-maas)
Modèles Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modèles e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5-Large (multilingual-e5-large-instruct-maas)

Amériques

Montréal(northamerica-northeast1) São Paulo(southamerica-east1)
Modèles Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modèles ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modèles OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modèles Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 (minimax-m2-maas)
Modèles Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modèles e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5-Large (multilingual-e5-large-instruct-maas)

Europe

Londres(europe-west2) Belgique(europe-west1) Pays-Bas(europe-west4) Zurich(europe-west6) Francfort(europe-west3) Finlande(europe-north1) Varsovie(europe-central2) Milan(europe-west8) Madrid(europe-southwest1) Paris(europe-west9)
Modèles Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modèles ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modèles OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modèles Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 (minimax-m2-maas)
Modèles Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modèles e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5-Large (multilingual-e5-large-instruct-maas)

Asie-Pacifique

Mumbai(asia-south1) Singapour(asia-southeast1) Hong Kong(asia-east2) Taïwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Séoul(asia-northeast3)
Modèles Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modèles ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modèles OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modèles Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 (minimax-m2-maas)
Modèles Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modèles e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5-Large (multilingual-e5-large-instruct-maas)

Moyen-Orient

Tel-Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modèles Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modèles ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modèles OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modèles Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modèles Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modèles MiniMax
MiniMax M2 (minimax-m2-maas)
Modèles Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modèles e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5-Large (multilingual-e5-large-instruct-maas)