Deployment ed endpoint

I modelli e le funzionalità di AI generativa di Google e dei partner su Vertex AI sono esposti come endpoint regionali specifici e un endpoint globale. Gli endpoint globali coprono il mondo intero e offrono maggiore disponibilità e affidabilità rispetto alle singole regioni.

Endpoint globale

Selezionare un endpoint globale per le richieste può migliorare la disponibilità complessiva riducendo gli errori di esaurimento delle risorse (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perché non puoi controllare o sapere a quale regione vengono inviate le tue richieste di elaborazione ML quando viene effettuata una richiesta.

Modelli supportati

L'utilizzo dell'endpoint globale è supportato per i seguenti modelli Google nelle regioni specificate. Per informazioni dettagliate sulle regioni che supportano l'endpoint globale, consulta la scheda Globale nella tabella delle località degli endpoint dei modelli Google.

Per informazioni sulla disponibilità degli endpoint globali per i modelli partner, consulta la scheda Globale nella Google Cloud tabella delle posizioni degli endpoint del modello partner.

Utilizzare l'endpoint globale

Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su global. Ad esempio, il seguente è l'URL dell'endpoint globale:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Per l'SDK Google Gen AI, crea un client che utilizzi la località global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Per SDK Vertex AI Python, inizializza l'SDK utilizzando la località global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitazioni

Le seguenti funzionalità non sono disponibili quando utilizzi l'endpoint globale:

  • Ottimizzazione
  • Previsione batch per i modelli Anthropic e OpenMaaS
  • Corpus di Retrieval-Augmented Generation (RAG) (le richieste RAG sono supportate)

L'utilizzo dell'endpoint globale con il throughput riservato è disponibile solo per i seguenti modelli:

Fai clic per visualizzare i modelli supportati per l'endpoint globale quando utilizzi il throughput riservato

Modello Ultima versione del modello supportata
Gemini 3 Flash anteprima gemini-3-flash-preview
Gemini 3 Pro anteprima gemini-3-pro-preview
Gemini 3 Pro Image anteprima gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash anteprima gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite anteprima gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Posizioni degli endpoint del modello Google

I modelli Google in Vertex AI sono disponibili per i seguenti endpoint:

Globale

Globale(globale)
Modelli Gemini
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro anteprima (gemini-3-pro-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelli di embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings per il testo
Incorporamenti per multimodale
Modelli Imagen su Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 Controlled Customization (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Modelli Veo su Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate anteprima (veo-2.0-generate-exp)
Veo 2 Generate anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Genera (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Anteprima di Gemini 2.5 Flash Lite TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Stati Uniti

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sud(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelli Gemini
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro anteprima (gemini-3-pro-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelli di embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings per il testo
Incorporamenti per multimodale
Modelli Imagen su Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 Controlled Customization (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Modelli Veo su Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate anteprima (veo-2.0-generate-exp)
Veo 2 Generate anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Genera (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Anteprima di Gemini 2.5 Flash Lite TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Americhe

Montréal(northamerica-northeast1) San Paolo(southamerica-east1)
Modelli Gemini
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro anteprima (gemini-3-pro-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelli di embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings per il testo
Incorporamenti per multimodale
Modelli Imagen su Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 Controlled Customization (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Modelli Veo su Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate anteprima (veo-2.0-generate-exp)
Veo 2 Generate anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Genera (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Anteprima di Gemini 2.5 Flash Lite TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Europa

Londra(europe-west2) Belgio(europe-west1) Paesi Bassi(europe-west4) Zurigo(europe-west6) Francoforte(europe-west3) Finlandia(europe-north1) Varsavia(europe-central2) Milano(europe-west8) Madrid(europe-southwest1) Parigi(europe-west9)
Modelli Gemini
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro anteprima (gemini-3-pro-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelli di embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings per il testo
Incorporamenti per multimodale
Modelli Imagen su Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 Controlled Customization (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Modelli Veo su Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate anteprima (veo-2.0-generate-exp)
Veo 2 Generate anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Genera (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Anteprima di Gemini 2.5 Flash Lite TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Asia Pacifico

Mumbai(asia-south1) Singapore(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelli Gemini
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro anteprima (gemini-3-pro-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelli di embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings per il testo
Incorporamenti per multimodale
Modelli Imagen su Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 Controlled Customization (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Modelli Veo su Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate anteprima (veo-2.0-generate-exp)
Veo 2 Generate anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Genera (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Anteprima di Gemini 2.5 Flash Lite TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Medio Oriente

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelli Gemini
Gemini 3 Flash anteprima (gemini-3-flash-preview)
Gemini 3 Pro anteprima (gemini-3-pro-preview)
Gemini 3 Pro Image anteprima (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash anteprima (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite anteprima (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live anteprima (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con l'API Gemini Live anteprima (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelli di embedding
Gemini Embeddings (gemini-embeddings-001)
Embeddings per il testo
Incorporamenti per multimodale
Modelli Imagen su Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 Controlled Customization (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Modelli Veo su Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate anteprima (veo-2.0-generate-exp)
Veo 2 Generate anteprima (veo-2.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-generate-preview)
Veo 3 Generate anteprima (veo-3.0-fast-generate-preview)
Veo 3 Genera (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Genera anteprima (veo-3.1-generate-preview)
Veo 3.1 Fast Generate anteprima (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelli Speech-to-Text e Text-to-Speech
Chirp 3: Trascrizione (chirp_3)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea
Chirp 2: Trascrizione (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Anteprima di Gemini 2.5 Flash Lite TTS anteprima (gemini-2.5-flash-lite-preview-tts)

Google Cloud posizioni degli endpoint del modello partner

Google gestisce le richieste dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di più, consulta la sezione "Endpoint regionali e globali" in Modelli partner Vertex AI per MaaS.

Gli endpoint dei modelli partner per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:

Globale

Globale(globale)
Modelli Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
Modelli Mistral
Mistral Medium 3
Mistral OCR (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Stati Uniti

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sud(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelli Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
Modelli Mistral
Mistral Medium 3
Mistral OCR (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Americhe

Montréal(northamerica-northeast1) San Paolo(southamerica-east1)
Modelli Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
Modelli Mistral
Mistral Medium 3
Mistral OCR (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Europa

Londra(europe-west2) Belgio(europe-west1) Paesi Bassi(europe-west4) Zurigo(europe-west6) Francoforte(europe-west3) Finlandia(europe-north1) Varsavia(europe-central2) Milano(europe-west8) Madrid(europe-southwest1) Parigi(europe-west9)
Modelli Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
Modelli Mistral
Mistral Medium 3
Mistral OCR (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Asia Pacifico

Mumbai(asia-south1) Singapore(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelli Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
Modelli Mistral
Mistral Medium 3
Mistral OCR (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Medio Oriente

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelli Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet di Anthropic
Claude 3.5 Haiku di Anthropic
Claude 3 Haiku di Anthropic
Modelli Mistral
Mistral Medium 3
Mistral OCR (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Google Cloud posizioni degli endpoint del modello aperto

Google gestisce le richieste dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di più, consulta la sezione "Endpoint regionali e globali" in Vertex AI open models for MaaS.

Gli endpoint dei modelli aperti per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:

Globale

Globale(globale)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli di Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Stati Uniti

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sud(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli di Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Americhe

Montréal(northamerica-northeast1) San Paolo(southamerica-east1)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli di Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Europa

Londra(europe-west2) Belgio(europe-west1) Paesi Bassi(europe-west4) Zurigo(europe-west6) Francoforte(europe-west3) Finlandia(europe-north1) Varsavia(europe-central2) Milano(europe-west8) Madrid(europe-southwest1) Parigi(europe-west9)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli di Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Asia Pacifico

Mumbai(asia-south1) Singapore(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tokyo(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli di Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Medio Oriente

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelli Deepseek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelli ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelli OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelli di Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelli di Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelli MiniMax
MiniMax M2 (minimax-m2-maas)
Modelli Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelli e5
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

Passaggi successivi