Deployment ed endpoint

I modelli e le funzionalità di AI generativa di Google e dei partner su Vertex AI sono esposti come endpoint regionali specifici e un endpoint globale. Gli endpoint globali coprono il mondo intero e offrono disponibilità e affidabilità superiori rispetto alle singole regioni.

Endpoint globale

Selezionare un endpoint globale per le richieste può migliorare la disponibilità complessiva riducendo gli errori di esaurimento delle risorse (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perché non puoi controllare o sapere a quale regione vengono inviate le tue richieste di elaborazione ML quando viene effettuata una richiesta.

Modelli supportati

L'utilizzo dell'endpoint globale è supportato per i seguenti modelli Google nelle regioni specificate. Per informazioni dettagliate sulle regioni che supportano l'endpoint globale, consulta la scheda Globale nella tabella delle località degli endpoint dei modelli Google.

Per informazioni sulla disponibilità degli endpoint globali per i modelli partner, consulta la scheda Globale nella Google Cloud tabella delle posizioni degli endpoint del modello partner.

Utilizza l'endpoint globale

Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e configura la località della risorsa su global. Ad esempio, il seguente è l'URL dell'endpoint globale:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Per l'SDK Google Gen AI, crea un client che utilizzi la località global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Per SDK Vertex AI Python, inizializza l'SDK utilizzando la località global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitazioni

Le seguenti funzionalità non sono disponibili quando utilizzi l'endpoint globale:

Ottimizzazione
Previsione batch per i modelli Anthropic e OpenMaaS
Corpus di Retrieval-Augmented Generation (RAG) (le richieste RAG sono supportate)

L'utilizzo dell'endpoint globale con il throughput riservato è disponibile solo per i seguenti modelli:

Modello	Ultima versione del modello supportata
Gemini 3 Flash (anteprima)	`gemini-3-flash-preview`
Gemini 3 Pro (anteprima)	`gemini-3-pro-preview`
Gemini 3 Pro Image (anteprima)	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash (anteprima)	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite (anteprima)	`gemini-2.5-flash-lite-preview-09-2025`
Gemini 2.5 Flash Image	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Posizioni degli endpoint del modello Google

Gli endpoint dei modelli Google per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni.

Stati Uniti

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina del Sud (us-east1)	Virginia del Nord (us-east4)	Oregon (us-west1)
Gemini 3 Pro (`gemini-3-pro-preview`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings per il testo
Incorporamenti per multimodale
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 Editing and Customization (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Genera sperimentale con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (anteprima) (`veo-3.0-generate-preview`)
Veo 3 Fast (anteprima) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (anteprima) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (anteprima) (`veo-3.1-fast-generate-preview`)
Chirp 3: Trascrizione (`chirp_3`)
Chirp 2: Trascrizione (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Anteprima di Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea

Canada

	Montréal (northamerica-northeast1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings per il testo
Incorporamenti per multimodale
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 Editing and Customization (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Genera sperimentale con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Trascrizione (`chirp_3`)
Chirp 2: Trascrizione (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Anteprima di Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea

Brasile

	San Paolo (southamerica-east1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings per il testo
Incorporamenti per multimodale
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 Editing and Customization (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Genera sperimentale con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Trascrizione (`chirp_3`)
Chirp 2: Trascrizione (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Anteprima di Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea

Europa

	Paesi Bassi (europe-west4)	Parigi, Francia (europe-west9)	Londra, Regno Unito (europe-west2)	Francoforte, Germania (europe-west3)	Belgio (europe-west1)	Zurigo, Svizzera (europe-west6)	Madrid, Spagna (europe-southwest1)	Milano, Italia (europe-west8)	Finlandia (europe-north1)	Varsavia, Polonia (europe-central2)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings per il testo
Incorporamenti per multimodale
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 Editing and Customization (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Genera sperimentale con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Trascrizione (`chirp_3`)
Chirp 2: Trascrizione (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Anteprima di Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea

Asia Pacifico

	Tokyo, Giappone (asia-northeast1)	Sydney, Australia (australia-southeast1)	Singapore (asia-southeast1)	Seul, Corea (asia-northeast3)	Taiwan (asia-east1)	Hong Kong, Cina (asia-east2)	Mumbai, India (asia-south1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings per il testo
Incorporamenti per multimodale
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 Editing and Customization (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Genera sperimentale con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Trascrizione (`chirp_3`)
Chirp 2: Trascrizione (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Anteprima di Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea

Medio Oriente

	Dammam, Arabia Saudita (me-central2)	Doha, Qatar (me-central1)	Tel Aviv, Israele (me-west1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings per il testo
Incorporamenti per multimodale
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 Editing and Customization (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Genera sperimentale con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Trascrizione (`chirp_3`)
Chirp 2: Trascrizione (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Anteprima di Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea

Globale

	Globale (globale)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo dell'API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings per il testo
Incorporamenti per multimodale
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Imagen 3 Editing and Customization (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Genera sperimentale con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Trascrizione (`chirp_3`)
Chirp 2: Trascrizione (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Anteprima di Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voci in HD
Chirp 3: voce personalizzata istantanea

Google Cloud posizioni degli endpoint del modello partner

Google gestisce le richieste dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di più, consulta la sezione "Endpoint regionali e globali" in Modelli partner Vertex AI per MaaS.

Gli endpoint dei modelli partner per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:

Stati Uniti

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina del Sud (us-east1)	Virginia del Nord (us-east4)	Oregon (us-west1)
Claude Opus 4.5 di Anthropic
Claude Sonnet 4.5 di Anthropic
Claude Opus 4.1 di Anthropic
Claude Haiku 4.5 di Anthropic
Claude Opus 4 di Anthropic
Claude Sonnet 4 di Anthropic
Claude 3.7 Sonnet di Anthropic (ritirato)
Claude 3.5 Haiku di Anthropic (ritirato)
Claude 3 Haiku di Anthropic
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Europa

	Paesi Bassi (europe-west4)	Belgio (europe-west1)
Claude Opus 4.5 di Anthropic
Claude Sonnet 4.5 di Anthropic
Claude Opus 4.1 di Anthropic
Claude Haiku 4.5
Claude Opus 4 di Anthropic
Claude Sonnet 4 di Anthropic
Claude 3.7 Sonnet di Anthropic (ritirato)
Claude 3.5 Haiku di Anthropic (ritirato)
Claude 3 Haiku di Anthropic
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Asia Pacifico

	Singapore (asia-southeast1)	Taiwan (asia-east1)
Claude Opus 4.5 di Anthropic
Claude Sonnet 4.5 di Anthropic
Claude Opus 4.1 di Anthropic
Claude Haiku 4.5 di Anthropic
Claude Opus 4 di Anthropic
Claude Sonnet 4 di Anthropic
Claude 3.7 Sonnet di Anthropic (ritirato)
Claude 3.5 Haiku di Anthropic (ritirato)
Claude 3 Haiku di Anthropic
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Globale

	Globale (globale)
Claude Opus 4.5 di Anthropic
Claude Sonnet 4.5 di Anthropic
Claude Opus 4.1 di Anthropic
Claude Haiku 4.5 di Anthropic
Claude Opus 4 di Anthropic
Claude Sonnet 4 di Anthropic
Claude 3.7 Sonnet di Anthropic (ritirato)
Claude 3.5 Haiku di Anthropic (ritirato)
Claude 3 Haiku di Anthropic
Mistral Medium 3
OCR Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24:07)
Codestral 2
Codestral (24.05)

Google Cloud posizioni degli endpoint del modello aperto

Gli endpoint dei modelli aperti per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:

Stati Uniti

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina del Sud (us-east1)	Virginia del Nord (us-east4)	Oregon (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (anteprima)
Llama 3.1 70B (anteprima)
Llama 3.1 405B
Llama 3.2 90B (anteprima)
Llama 3.3 70B (anteprima)
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
MiniMax M2
Multilingue E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

	Paesi Bassi (europe-west4)	Belgio (europe-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (anteprima)
Llama 3.1 70B (anteprima)
Llama 3.1 405B
Llama 3.2 90B (anteprima)
Llama 3.3 70B (anteprima)
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
MiniMax M2
Multilingue E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Asia Pacifico

	Singapore (asia-southeast1)	Taiwan (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (anteprima)
Llama 3.1 70B (anteprima)
Llama 3.1 405B
Llama 3.2 90B (anteprima)
Llama 3.3 70B (anteprima)
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
MiniMax M2
Multilingue E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Globale

	Globale (globale)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (anteprima)
Llama 3.1 70B (anteprima)
Llama 3.1 405B
Llama 3.2 90B (anteprima)
Llama 3.3 70B (anteprima)
Llama 4 Maverick 17B-128E (anteprima)
Llama 4 Scout 17B-16E (anteprima)
MiniMax M2
Multilingue E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Passaggi successivi

Per un tutorial sui notebook che mostra l'endpoint globale, consulta Introduzione all'endpoint globale Vertex AI.
Scopri di più sulla residenza dei dati dell'AI generativa su Vertex AI.
Scopri di più sulle regioniGoogle Cloud .
Scopri di più sui controlli di sicurezza per funzionalità.
Scopri di più sui modelli che forniscono il supporto dell'AI generativa su Vertex AI. Consulta il riferimento al modello di base di AI generativa.
Scopri di più sulle località di Vertex AI.

Deployment ed endpoint Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Endpoint globale

Modelli supportati

Utilizza l'endpoint globale

Limitazioni

Posizioni degli endpoint del modello Google

Stati Uniti

Canada

Brasile

Europa

Asia Pacifico

Medio Oriente

Globale

Google Cloud posizioni degli endpoint del modello partner

Stati Uniti

Europa

Asia Pacifico

Globale

Google Cloud posizioni degli endpoint del modello aperto

Stati Uniti

Europa

Asia Pacifico

Globale

Passaggi successivi

Deployment ed endpoint