Deployment ed endpoint

I modelli e le funzionalità di AI generativa di Google e dei partner sulla piattaforma agentica Gemini Enterprise sono esposti come endpoint regionali specifici e un endpoint globale. Gli endpoint globali coprono il mondo intero e offrono maggiore disponibilità e affidabilità rispetto alle singole regioni.

Specifica un endpoint

Per gli endpoint regionali standard (ad esempio us-central) e l'endpoint globale:

Python

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='GOOGLE_CLOUD_PROJECT', location='GOOGLE_CLOUD_LOCATION')

Python

client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION"
MODEL_ID="MODEL_ID"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://${GOOGLE_CLOUD_LOCATION}$-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words."
      }
    }
  }'

Endpoint multiregionali

Gli endpoint multiregionali ti consentono di garantire che l'elaborazione del machine learning dei dati dei clienti da parte del servizio rimanga all'interno di un confine giurisdizionale specifico, ad esempio gli Stati Uniti o l'Unione Europea.

La tabella seguente elenca i nomi host per gli endpoint multiregionali:

Più regioni Località Nome host
Stati Uniti us https://aiplatform.us.rep.googleapis.com
Unione Europea eu https://aiplatform.eu.rep.googleapis.com

Python

import vertexai
from google.adk.agents import Agent

# Set the multi-region location on the client
client = vertexai.Client(
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

# The agent will use this configuration
agent = Agent(
    model="gemini-2.5-flash",
    name='my_agent'
)

Python

from google import genai

# location must be set to 'us' or 'eu' for multi-region routing
client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
MODEL_ID="MODEL_ID"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION" # Must be 'us' or 'eu'
# Explicitly use the .rep. hostname for multi-region endpoints
API_ENDPOINT="https://aiplatform.${GOOGLE_CLOUD_LOCATION}.rep.googleapis.com"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "${API_ENDPOINT}/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words"
      }
    }
  }'

Endpoint globale

Selezionare un endpoint globale per le richieste può migliorare la disponibilità complessiva riducendo gli errori di esaurimento delle risorse (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perché non puoi controllare o sapere a quale regione vengono inviate le tue richieste di elaborazione ML quando viene effettuata una richiesta.

Modelli supportati

L'utilizzo dell'endpoint globale è supportato per i seguenti modelli Google nelle regioni specificate. Per informazioni dettagliate sui modelli che supportano l'endpoint globale, consulta la scheda Globale nella tabella delle posizioni degli endpoint dei modelli Google.

Per informazioni sulla disponibilità degli endpoint globali per i modelli partner, consulta la scheda Globale nella Google Cloud tabella delle posizioni degli endpoint del modello partner.

Limitazioni

Le seguenti funzionalità non sono disponibili quando si utilizza l'endpoint globale:

  • Ottimizzazione
  • Previsioni in batch per i modelli Anthropic e OpenMaaS
  • Corpus Retrieval-Augmented Generation (RAG) (le richieste RAG sono supportate)

L'utilizzo dell'endpoint globale con il throughput riservato è disponibile solo per i seguenti modelli:

Fai clic per visualizzare i modelli supportati per l'endpoint globale quando utilizzi il throughput riservato

Modello Ultima versione del modello supportata
Gemini 3.5 Flash gemini-3.5-flash
Gemini 3.1 Flash-Lite gemini-3.1-flash-lite
Gemini 3.1 Flash Image anteprima gemini-3.1-flash-image-preview
Gemini 3.1 Pro anteprima gemini-3.1-pro-preview
Gemini 3 Flash (anteprima) gemini-3-flash-preview
Gemini 3 Pro Image anteprima gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash anteprima gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite anteprima gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite

Posizioni degli endpoint del modello Google

I modelli Google in Gemini Enterprise Agent Platform sono disponibili per i seguenti endpoint:

Globale

Globale(globale)
Modelli Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image anteprima (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro anteprima (gemini-3.1-pro-preview)
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Modelli di embedding
Gemini Embedding 2 (gemini-embedding-2)
Embedding Gemini (gemini-embedding-001)
Embedding per il testo
Embedding per multimodale
Veo sui modelli Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate Anteprima (veo-2.0-generate-exp)
Veo 2 Generate Anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate Anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Genera (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate anteprima (veo-3.1-lite-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Più regioni

Stati Uniti (multi-regione)(us) UE (multi-regione)(eu)
Modelli Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image anteprima (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro anteprima (gemini-3.1-pro-preview)
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Modelli di embedding
Gemini Embedding 2 (gemini-embedding-2)
Embedding Gemini (gemini-embedding-001)
Embedding per il testo
Embedding per multimodale
Veo sui modelli Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate Anteprima (veo-2.0-generate-exp)
Veo 2 Generate Anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate Anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Genera (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate anteprima (veo-3.1-lite-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Stati Uniti

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sud(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelli Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image anteprima (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro anteprima (gemini-3.1-pro-preview)
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Modelli di embedding
Gemini Embedding 2 (gemini-embedding-2)
Embedding Gemini (gemini-embedding-001)
Embedding per il testo
Embedding per multimodale
Veo sui modelli Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate Anteprima (veo-2.0-generate-exp)
Veo 2 Generate Anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate Anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Genera (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate anteprima (veo-3.1-lite-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Americhe

Montréal(northamerica-northeast1) San Paolo(southamerica-east1)
Modelli Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image anteprima (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro anteprima (gemini-3.1-pro-preview)
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Modelli di embedding
Gemini Embedding 2 (gemini-embedding-2)
Embedding Gemini (gemini-embedding-001)
Embedding per il testo
Embedding per multimodale
Veo sui modelli Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate Anteprima (veo-2.0-generate-exp)
Veo 2 Generate Anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate Anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Genera (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate anteprima (veo-3.1-lite-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Europa

Londra(europe-west2) Belgio(europe-west1) Paesi Bassi(europe-west4) Zurigo(europe-west6) Francoforte(europe-west3) Finlandia(europe-north1) Varsavia(europe-central2) Milano(europe-west8) Madrid(europe-southwest1) Parigi(europe-west9)
Modelli Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image anteprima (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro anteprima (gemini-3.1-pro-preview)
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Modelli di embedding
Gemini Embedding 2 (gemini-embedding-2)
Embedding Gemini (gemini-embedding-001)
Embedding per il testo
Embedding per multimodale
Veo sui modelli Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate Anteprima (veo-2.0-generate-exp)
Veo 2 Generate Anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate Anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Genera (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate anteprima (veo-3.1-lite-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Asia Pacifico

Mumbai(asia-south1) Singapore(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelli Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image anteprima (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro anteprima (gemini-3.1-pro-preview)
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Modelli di embedding
Gemini Embedding 2 (gemini-embedding-2)
Embedding Gemini (gemini-embedding-001)
Embedding per il testo
Embedding per multimodale
Veo sui modelli Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate Anteprima (veo-2.0-generate-exp)
Veo 2 Generate Anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate Anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Genera (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate anteprima (veo-3.1-lite-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Medio Oriente

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelli Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image anteprima (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro anteprima (gemini-3.1-pro-preview)
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Modelli di embedding
Gemini Embedding 2 (gemini-embedding-2)
Embedding Gemini (gemini-embedding-001)
Embedding per il testo
Embedding per multimodale
Veo sui modelli Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate Anteprima (veo-2.0-generate-exp)
Veo 2 Generate Anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate Anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Genera (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate anteprima (veo-3.1-lite-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite Preview TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Google Cloud posizioni degli endpoint del modello partner

Google gestisce le richieste dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di più, consulta la sezione "Endpoint regionali e globali" in Modelli partner di Gemini Enterprise Agent Platform per MaaS.

Gli endpoint del modello partner per Agent Platform sono disponibili nelle seguenti regioni:

Globale

Globale(globale)
Modelli Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic (deprecato)
Modelli Mistral
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Più regioni

Stati Uniti (multi-regione)(us) UE (multi-regione)(eu)
Modelli Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic (deprecato)
Modelli Mistral
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Stati Uniti

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sud(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelli Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic (deprecato)
Modelli Mistral
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Americhe

Montréal(northamerica-northeast1) San Paolo(southamerica-east1)
Modelli Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic (deprecato)
Modelli Mistral
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

Londra(europe-west2) Belgio(europe-west1) Paesi Bassi(europe-west4) Zurigo(europe-west6) Francoforte(europe-west3) Finlandia(europe-north1) Varsavia(europe-central2) Milano(europe-west8) Madrid(europe-southwest1) Parigi(europe-west9)
Modelli Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic (deprecato)
Modelli Mistral
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asia Pacifico

Mumbai(asia-south1) Singapore(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelli Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic (deprecato)
Modelli Mistral
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Medio Oriente

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelli Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic (deprecato)
Modelli Mistral
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud posizioni degli endpoint del modello aperto

Google gestisce le richieste dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di più, consulta la sezione "Endpoint regionali e globali" in Modelli open source della piattaforma agentica Gemini Enterprise per MaaS.

Gli endpoint dei modelli aperti per Agent Platform sono disponibili nelle seguenti regioni:

Globale

Globale(globale)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Più regioni

Stati Uniti (multi-regione)(us) UE (multi-regione)(eu)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Stati Uniti

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sud(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Americhe

Montréal(northamerica-northeast1) San Paolo(southamerica-east1)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Europa

Londra(europe-west2) Belgio(europe-west1) Paesi Bassi(europe-west4) Zurigo(europe-west6) Francoforte(europe-west3) Finlandia(europe-north1) Varsavia(europe-central2) Milano(europe-west8) Madrid(europe-southwest1) Parigi(europe-west9)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Asia Pacifico

Mumbai(asia-south1) Singapore(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Medio Oriente

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)