I modelli e le funzionalità di AI generativa di Google e dei partner su Vertex AI sono esposti come endpoint regionali specifici e un endpoint globale. Gli endpoint globali coprono il mondo intero e offrono maggiore disponibilità e affidabilità rispetto alle singole regioni.
Endpoint globale
Selezionare un endpoint globale per le richieste può migliorare la disponibilità complessiva riducendo gli errori di esaurimento delle risorse (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perché non puoi controllare o sapere a quale regione vengono inviate le tue richieste di elaborazione ML quando viene effettuata una richiesta.
Modelli supportati
L'utilizzo dell'endpoint globale è supportato per i seguenti modelli Google nelle regioni specificate. Per informazioni dettagliate sulle regioni che supportano l'endpoint globale, consulta la scheda Globale nella tabella delle località degli endpoint dei modelli Google.
- Gemini 3 Flash (anteprima)
- Gemini 3 Pro (anteprima)
- Gemini 3 Pro Image (anteprima)
- Gemini 2.5 Pro
- Gemini 2.5 Flash (anteprima)
- Gemini 2.5 Flash-Lite (anteprima)
- Gemini 2.5 Flash Image
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Per informazioni sulla disponibilità degli endpoint globali per i modelli partner, consulta la scheda Globale nella Google Cloud tabella delle posizioni degli endpoint del modello partner.
Utilizzare l'endpoint globale
Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e
configura la località della risorsa su global. Ad esempio, il seguente
è l'URL dell'endpoint globale:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Per l'SDK Google Gen AI, crea un client che utilizzi la località global:
# google-genai >= 0.8.0 is required
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Per SDK Vertex AI Python,
inizializza l'SDK utilizzando la località global:
# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitazioni
Le seguenti funzionalità non sono disponibili quando utilizzi l'endpoint globale:
- Ottimizzazione
- Previsione batch per i modelli Anthropic e OpenMaaS
- Corpus di Retrieval-Augmented Generation (RAG) (le richieste RAG sono supportate)
L'utilizzo dell'endpoint globale con il throughput riservato è disponibile solo per i seguenti modelli:
Fai clic per visualizzare i modelli supportati per l'endpoint globale quando utilizzi il throughput riservato
| Modello | Ultima versione del modello supportata |
|---|---|
| Gemini 3 Flash anteprima | gemini-3-flash-preview |
| Gemini 3 Pro anteprima | gemini-3-pro-preview |
| Gemini 3 Pro Image anteprima | gemini-3-pro-image-preview |
| Gemini 2.5 Pro | gemini-2.5-pro |
| Gemini 2.5 Flash anteprima | gemini-2.5-flash-preview-09-2025 |
| Gemini 2.5 Flash-Lite anteprima | gemini-2.5-flash-lite-preview-09-2025 |
| Gemini 2.5 Flash Image | gemini-2.5-flash-image |
| Gemini 2.5 Flash | gemini-2.5-flash |
| Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
| Gemini 2.0 Flash | gemini-2.0-flash-001 |
| Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Posizioni degli endpoint del modello Google
I modelli Google in Vertex AI sono disponibili per i seguenti endpoint:
Globale
| Globale(globale) | |
|---|---|
| Modelli Gemini | |
Gemini 3 Flash
anteprima
(gemini-3-flash-preview)
|
|
Gemini 3 Pro
anteprima
(gemini-3-pro-preview)
|
|
Gemini 3 Pro Image
anteprima
(gemini-3-pro-image-preview)
|
|
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|
Gemini 2.5 Flash
anteprima
(gemini-2.5-flash-preview-09-2025)
|
|
Gemini 2.5 Flash-Lite
anteprima
(gemini-2.5-flash-lite-preview-09-2025)
|
|
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
|
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
|
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
anteprima
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|
Gemini 2.0 Flash con l'API Gemini Live
anteprima
(gemini-2.0-flash-live-preview-04-09)
|
|
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
|
| Modelli di embedding | |
Gemini Embeddings
(gemini-embeddings-001)
|
|
| Embeddings per il testo | |
| Incorporamenti per multimodale | |
| Modelli Imagen su Vertex AI | |
Imagen 3
(imagen-3.0-generate-002)
|
|
Imagen 3
(imagen-3.0-generate-001)
|
|
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|
Imagen 3 Controlled Customization
(imagen-3.0-capability-001)
|
|
Imagen 4
(imagen-4.0-generate-001)
|
|
Imagen 4
(imagen-4.0-fast-generate-001)
|
|
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
|
| Modelli Veo su Vertex AI | |
Veo 2 Generate
(veo-2.0-generate-001)
|
|
Veo 2 Generate
anteprima
(veo-2.0-generate-exp)
|
|
Veo 2 Generate
anteprima
(veo-2.0-generate-preview)
|
|
Veo 3 Generate
anteprima
(veo-3.0-generate-preview)
|
|
Veo 3 Generate
anteprima
(veo-3.0-fast-generate-preview)
|
|
Veo 3 Genera
(veo-3.0-generate-001)
|
|
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
|
Veo 3.1 Genera
anteprima
(veo-3.1-generate-preview)
|
|
Veo 3.1 Fast Generate
anteprima
(veo-3.1-fast-generate-preview)
|
|
Veo 3.1 Generate
(veo-3.1-generate-001)
|
|
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
|
| Modelli Speech-to-Text e Text-to-Speech | |
Chirp 3: Trascrizione
(chirp_3)
|
|
| Chirp 3: voci in HD | |
| Chirp 3: voce personalizzata istantanea | |
Chirp 2: Trascrizione
(chirp_2)
|
|
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|
Anteprima di Gemini 2.5 Flash Lite TTS
anteprima
(gemini-2.5-flash-lite-preview-tts)
|
|
Stati Uniti
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | Carolina del Sud(us-east1) | N. Virginia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Modelli Gemini | |||||||
Gemini 3 Flash
anteprima
(gemini-3-flash-preview)
|
|||||||
Gemini 3 Pro
anteprima
(gemini-3-pro-preview)
|
|||||||
Gemini 3 Pro Image
anteprima
(gemini-3-pro-image-preview)
|
|||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||||||
Gemini 2.5 Flash
anteprima
(gemini-2.5-flash-preview-09-2025)
|
|||||||
Gemini 2.5 Flash-Lite
anteprima
(gemini-2.5-flash-lite-preview-09-2025)
|
|||||||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
|||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||||||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
|||||||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
anteprima
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||||||
Gemini 2.0 Flash con l'API Gemini Live
anteprima
(gemini-2.0-flash-live-preview-04-09)
|
|||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||||||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
|||||||
| Modelli di embedding | |||||||
Gemini Embeddings
(gemini-embeddings-001)
|
|||||||
| Embeddings per il testo | |||||||
| Incorporamenti per multimodale | |||||||
| Modelli Imagen su Vertex AI | |||||||
Imagen 3
(imagen-3.0-generate-002)
|
|||||||
Imagen 3
(imagen-3.0-generate-001)
|
|||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||||||
Imagen 3 Controlled Customization
(imagen-3.0-capability-001)
|
|||||||
Imagen 4
(imagen-4.0-generate-001)
|
|||||||
Imagen 4
(imagen-4.0-fast-generate-001)
|
|||||||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
|||||||
| Modelli Veo su Vertex AI | |||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||||||
Veo 2 Generate
anteprima
(veo-2.0-generate-exp)
|
|||||||
Veo 2 Generate
anteprima
(veo-2.0-generate-preview)
|
|||||||
Veo 3 Generate
anteprima
(veo-3.0-generate-preview)
|
|||||||
Veo 3 Generate
anteprima
(veo-3.0-fast-generate-preview)
|
|||||||
Veo 3 Genera
(veo-3.0-generate-001)
|
|||||||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
|||||||
Veo 3.1 Genera
anteprima
(veo-3.1-generate-preview)
|
|||||||
Veo 3.1 Fast Generate
anteprima
(veo-3.1-fast-generate-preview)
|
|||||||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
|||||||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
|||||||
| Modelli Speech-to-Text e Text-to-Speech | |||||||
Chirp 3: Trascrizione
(chirp_3)
|
|||||||
| Chirp 3: voci in HD | |||||||
| Chirp 3: voce personalizzata istantanea | |||||||
Chirp 2: Trascrizione
(chirp_2)
|
|||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||||||
Anteprima di Gemini 2.5 Flash Lite TTS
anteprima
(gemini-2.5-flash-lite-preview-tts)
|
|||||||
Americhe
| Montréal(northamerica-northeast1) | San Paolo(southamerica-east1) | |
|---|---|---|
| Modelli Gemini | ||
Gemini 3 Flash
anteprima
(gemini-3-flash-preview)
|
||
Gemini 3 Pro
anteprima
(gemini-3-pro-preview)
|
||
Gemini 3 Pro Image
anteprima
(gemini-3-pro-image-preview)
|
||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
||
Gemini 2.5 Flash
anteprima
(gemini-2.5-flash-preview-09-2025)
|
||
Gemini 2.5 Flash-Lite
anteprima
(gemini-2.5-flash-lite-preview-09-2025)
|
||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
anteprima
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
||
Gemini 2.0 Flash con l'API Gemini Live
anteprima
(gemini-2.0-flash-live-preview-04-09)
|
||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
||
| Modelli di embedding | ||
Gemini Embeddings
(gemini-embeddings-001)
|
||
| Embeddings per il testo | ||
| Incorporamenti per multimodale | ||
| Modelli Imagen su Vertex AI | ||
Imagen 3
(imagen-3.0-generate-002)
|
||
Imagen 3
(imagen-3.0-generate-001)
|
||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
||
Imagen 3 Controlled Customization
(imagen-3.0-capability-001)
|
||
Imagen 4
(imagen-4.0-generate-001)
|
||
Imagen 4
(imagen-4.0-fast-generate-001)
|
||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
||
| Modelli Veo su Vertex AI | ||
Veo 2 Generate
(veo-2.0-generate-001)
|
||
Veo 2 Generate
anteprima
(veo-2.0-generate-exp)
|
||
Veo 2 Generate
anteprima
(veo-2.0-generate-preview)
|
||
Veo 3 Generate
anteprima
(veo-3.0-generate-preview)
|
||
Veo 3 Generate
anteprima
(veo-3.0-fast-generate-preview)
|
||
Veo 3 Genera
(veo-3.0-generate-001)
|
||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
||
Veo 3.1 Genera
anteprima
(veo-3.1-generate-preview)
|
||
Veo 3.1 Fast Generate
anteprima
(veo-3.1-fast-generate-preview)
|
||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
||
| Modelli Speech-to-Text e Text-to-Speech | ||
Chirp 3: Trascrizione
(chirp_3)
|
||
| Chirp 3: voci in HD | ||
| Chirp 3: voce personalizzata istantanea | ||
Chirp 2: Trascrizione
(chirp_2)
|
||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
||
Anteprima di Gemini 2.5 Flash Lite TTS
anteprima
(gemini-2.5-flash-lite-preview-tts)
|
||
Europa
| Londra(europe-west2) | Belgio(europe-west1) | Paesi Bassi(europe-west4) | Zurigo(europe-west6) | Francoforte(europe-west3) | Finlandia(europe-north1) | Varsavia(europe-central2) | Milano(europe-west8) | Madrid(europe-southwest1) | Parigi(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Modelli Gemini | ||||||||||
Gemini 3 Flash
anteprima
(gemini-3-flash-preview)
|
||||||||||
Gemini 3 Pro
anteprima
(gemini-3-pro-preview)
|
||||||||||
Gemini 3 Pro Image
anteprima
(gemini-3-pro-image-preview)
|
||||||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
||||||||||
Gemini 2.5 Flash
anteprima
(gemini-2.5-flash-preview-09-2025)
|
||||||||||
Gemini 2.5 Flash-Lite
anteprima
(gemini-2.5-flash-lite-preview-09-2025)
|
||||||||||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
||||||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
||||||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
||||||||||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
||||||||||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
anteprima
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
||||||||||
Gemini 2.0 Flash con l'API Gemini Live
anteprima
(gemini-2.0-flash-live-preview-04-09)
|
||||||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
||||||||||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
||||||||||
| Modelli di embedding | ||||||||||
Gemini Embeddings
(gemini-embeddings-001)
|
||||||||||
| Embeddings per il testo | ||||||||||
| Incorporamenti per multimodale | ||||||||||
| Modelli Imagen su Vertex AI | ||||||||||
Imagen 3
(imagen-3.0-generate-002)
|
||||||||||
Imagen 3
(imagen-3.0-generate-001)
|
||||||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
||||||||||
Imagen 3 Controlled Customization
(imagen-3.0-capability-001)
|
||||||||||
Imagen 4
(imagen-4.0-generate-001)
|
||||||||||
Imagen 4
(imagen-4.0-fast-generate-001)
|
||||||||||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
||||||||||
| Modelli Veo su Vertex AI | ||||||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
||||||||||
Veo 2 Generate
anteprima
(veo-2.0-generate-exp)
|
||||||||||
Veo 2 Generate
anteprima
(veo-2.0-generate-preview)
|
||||||||||
Veo 3 Generate
anteprima
(veo-3.0-generate-preview)
|
||||||||||
Veo 3 Generate
anteprima
(veo-3.0-fast-generate-preview)
|
||||||||||
Veo 3 Genera
(veo-3.0-generate-001)
|
||||||||||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
||||||||||
Veo 3.1 Genera
anteprima
(veo-3.1-generate-preview)
|
||||||||||
Veo 3.1 Fast Generate
anteprima
(veo-3.1-fast-generate-preview)
|
||||||||||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
||||||||||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
||||||||||
| Modelli Speech-to-Text e Text-to-Speech | ||||||||||
Chirp 3: Trascrizione
(chirp_3)
|
||||||||||
| Chirp 3: voci in HD | ||||||||||
| Chirp 3: voce personalizzata istantanea | ||||||||||
Chirp 2: Trascrizione
(chirp_2)
|
||||||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
||||||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
||||||||||
Anteprima di Gemini 2.5 Flash Lite TTS
anteprima
(gemini-2.5-flash-lite-preview-tts)
|
||||||||||
Asia Pacifico
| Mumbai(asia-south1) | Singapore(asia-southeast1) | Hong Kong(asia-east2) | Taiwan(asia-east1) | Tokyo(asia-northeast1) | Sydney(australia-southeast1) | Seul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Modelli Gemini | |||||||
Gemini 3 Flash
anteprima
(gemini-3-flash-preview)
|
|||||||
Gemini 3 Pro
anteprima
(gemini-3-pro-preview)
|
|||||||
Gemini 3 Pro Image
anteprima
(gemini-3-pro-image-preview)
|
|||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||||||
Gemini 2.5 Flash
anteprima
(gemini-2.5-flash-preview-09-2025)
|
|||||||
Gemini 2.5 Flash-Lite
anteprima
(gemini-2.5-flash-lite-preview-09-2025)
|
|||||||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
|||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||||||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
|||||||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
anteprima
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||||||
Gemini 2.0 Flash con l'API Gemini Live
anteprima
(gemini-2.0-flash-live-preview-04-09)
|
|||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||||||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
|||||||
| Modelli di embedding | |||||||
Gemini Embeddings
(gemini-embeddings-001)
|
|||||||
| Embeddings per il testo | |||||||
| Incorporamenti per multimodale | |||||||
| Modelli Imagen su Vertex AI | |||||||
Imagen 3
(imagen-3.0-generate-002)
|
|||||||
Imagen 3
(imagen-3.0-generate-001)
|
|||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||||||
Imagen 3 Controlled Customization
(imagen-3.0-capability-001)
|
|||||||
Imagen 4
(imagen-4.0-generate-001)
|
|||||||
Imagen 4
(imagen-4.0-fast-generate-001)
|
|||||||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
|||||||
| Modelli Veo su Vertex AI | |||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||||||
Veo 2 Generate
anteprima
(veo-2.0-generate-exp)
|
|||||||
Veo 2 Generate
anteprima
(veo-2.0-generate-preview)
|
|||||||
Veo 3 Generate
anteprima
(veo-3.0-generate-preview)
|
|||||||
Veo 3 Generate
anteprima
(veo-3.0-fast-generate-preview)
|
|||||||
Veo 3 Genera
(veo-3.0-generate-001)
|
|||||||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
|||||||
Veo 3.1 Genera
anteprima
(veo-3.1-generate-preview)
|
|||||||
Veo 3.1 Fast Generate
anteprima
(veo-3.1-fast-generate-preview)
|
|||||||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
|||||||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
|||||||
| Modelli Speech-to-Text e Text-to-Speech | |||||||
Chirp 3: Trascrizione
(chirp_3)
|
|||||||
| Chirp 3: voci in HD | |||||||
| Chirp 3: voce personalizzata istantanea | |||||||
Chirp 2: Trascrizione
(chirp_2)
|
|||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||||||
Anteprima di Gemini 2.5 Flash Lite TTS
anteprima
(gemini-2.5-flash-lite-preview-tts)
|
|||||||
Medio Oriente
| Tel Aviv(me-west1) | Doha(me-central1) | Dammam(me-central2) | |
|---|---|---|---|
| Modelli Gemini | |||
Gemini 3 Flash
anteprima
(gemini-3-flash-preview)
|
|||
Gemini 3 Pro
anteprima
(gemini-3-pro-preview)
|
|||
Gemini 3 Pro Image
anteprima
(gemini-3-pro-image-preview)
|
|||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||
Gemini 2.5 Flash
anteprima
(gemini-2.5-flash-preview-09-2025)
|
|||
Gemini 2.5 Flash-Lite
anteprima
(gemini-2.5-flash-lite-preview-09-2025)
|
|||
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
|
|||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
|||
Gemini 2.5 Flash con audio nativo dell'API Gemini Live
anteprima
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||
Gemini 2.0 Flash con l'API Gemini Live
anteprima
(gemini-2.0-flash-live-preview-04-09)
|
|||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite)
|
|||
| Modelli di embedding | |||
Gemini Embeddings
(gemini-embeddings-001)
|
|||
| Embeddings per il testo | |||
| Incorporamenti per multimodale | |||
| Modelli Imagen su Vertex AI | |||
Imagen 3
(imagen-3.0-generate-002)
|
|||
Imagen 3
(imagen-3.0-generate-001)
|
|||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||
Imagen 3 Controlled Customization
(imagen-3.0-capability-001)
|
|||
Imagen 4
(imagen-4.0-generate-001)
|
|||
Imagen 4
(imagen-4.0-fast-generate-001)
|
|||
Imagen 4 Ultra Generate
(imagen-4.0-ultra-generate-001)
|
|||
| Modelli Veo su Vertex AI | |||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||
Veo 2 Generate
anteprima
(veo-2.0-generate-exp)
|
|||
Veo 2 Generate
anteprima
(veo-2.0-generate-preview)
|
|||
Veo 3 Generate
anteprima
(veo-3.0-generate-preview)
|
|||
Veo 3 Generate
anteprima
(veo-3.0-fast-generate-preview)
|
|||
Veo 3 Genera
(veo-3.0-generate-001)
|
|||
Veo 3 Fast Generate
(veo-3.0-fast-generate-001)
|
|||
Veo 3.1 Genera
anteprima
(veo-3.1-generate-preview)
|
|||
Veo 3.1 Fast Generate
anteprima
(veo-3.1-fast-generate-preview)
|
|||
Veo 3.1 Generate
(veo-3.1-generate-001)
|
|||
Veo 3.1 Fast Generate
(veo-3.1-fast-generate-001)
|
|||
| Modelli Speech-to-Text e Text-to-Speech | |||
Chirp 3: Trascrizione
(chirp_3)
|
|||
| Chirp 3: voci in HD | |||
| Chirp 3: voce personalizzata istantanea | |||
Chirp 2: Trascrizione
(chirp_2)
|
|||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||
Anteprima di Gemini 2.5 Flash Lite TTS
anteprima
(gemini-2.5-flash-lite-preview-tts)
|
|||
Google Cloud posizioni degli endpoint del modello partner
Google gestisce le richieste dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di più, consulta la sezione "Endpoint regionali e globali" in Modelli partner Vertex AI per MaaS.
Gli endpoint dei modelli partner per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:
Globale
| Globale(globale) | |
|---|---|
| Modelli Anthropic | |
| Claude Opus 4.6 | |
| Claude Opus 4.5 | |
| Claude Sonnet 4.5 | |
| Claude Opus 4.1 | |
| Claude Haiku 4.5 | |
| Claude Opus 4 | |
| Claude Sonnet 4 | |
| Claude 3.7 Sonnet di Anthropic | |
| Claude 3.5 Haiku di Anthropic | |
| Claude 3 Haiku di Anthropic | |
| Modelli Mistral | |
| Mistral Medium 3 | |
| Mistral OCR (25/05) | |
| Mistral Small 3.1 (25.03) | |
| Mistral Large (24:07) | |
| Codestral 2 | |
| Codestral (24.05) | |
Stati Uniti
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | Carolina del Sud(us-east1) | N. Virginia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Modelli Anthropic | |||||||
| Claude Opus 4.6 | |||||||
| Claude Opus 4.5 | |||||||
| Claude Sonnet 4.5 | |||||||
| Claude Opus 4.1 | |||||||
| Claude Haiku 4.5 | |||||||
| Claude Opus 4 | |||||||
| Claude Sonnet 4 | |||||||
| Claude 3.7 Sonnet di Anthropic | |||||||
| Claude 3.5 Haiku di Anthropic | |||||||
| Claude 3 Haiku di Anthropic | |||||||
| Modelli Mistral | |||||||
| Mistral Medium 3 | |||||||
| Mistral OCR (25/05) | |||||||
| Mistral Small 3.1 (25.03) | |||||||
| Mistral Large (24:07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) | |||||||
Americhe
| Montréal(northamerica-northeast1) | San Paolo(southamerica-east1) | |
|---|---|---|
| Modelli Anthropic | ||
| Claude Opus 4.6 | ||
| Claude Opus 4.5 | ||
| Claude Sonnet 4.5 | ||
| Claude Opus 4.1 | ||
| Claude Haiku 4.5 | ||
| Claude Opus 4 | ||
| Claude Sonnet 4 | ||
| Claude 3.7 Sonnet di Anthropic | ||
| Claude 3.5 Haiku di Anthropic | ||
| Claude 3 Haiku di Anthropic | ||
| Modelli Mistral | ||
| Mistral Medium 3 | ||
| Mistral OCR (25/05) | ||
| Mistral Small 3.1 (25.03) | ||
| Mistral Large (24:07) | ||
| Codestral 2 | ||
| Codestral (24.05) | ||
Europa
| Londra(europe-west2) | Belgio(europe-west1) | Paesi Bassi(europe-west4) | Zurigo(europe-west6) | Francoforte(europe-west3) | Finlandia(europe-north1) | Varsavia(europe-central2) | Milano(europe-west8) | Madrid(europe-southwest1) | Parigi(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Modelli Anthropic | ||||||||||
| Claude Opus 4.6 | ||||||||||
| Claude Opus 4.5 | ||||||||||
| Claude Sonnet 4.5 | ||||||||||
| Claude Opus 4.1 | ||||||||||
| Claude Haiku 4.5 | ||||||||||
| Claude Opus 4 | ||||||||||
| Claude Sonnet 4 | ||||||||||
| Claude 3.7 Sonnet di Anthropic | ||||||||||
| Claude 3.5 Haiku di Anthropic | ||||||||||
| Claude 3 Haiku di Anthropic | ||||||||||
| Modelli Mistral | ||||||||||
| Mistral Medium 3 | ||||||||||
| Mistral OCR (25/05) | ||||||||||
| Mistral Small 3.1 (25.03) | ||||||||||
| Mistral Large (24:07) | ||||||||||
| Codestral 2 | ||||||||||
| Codestral (24.05) | ||||||||||
Asia Pacifico
| Mumbai(asia-south1) | Singapore(asia-southeast1) | Hong Kong(asia-east2) | Taiwan(asia-east1) | Tokyo(asia-northeast1) | Sydney(australia-southeast1) | Seul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Modelli Anthropic | |||||||
| Claude Opus 4.6 | |||||||
| Claude Opus 4.5 | |||||||
| Claude Sonnet 4.5 | |||||||
| Claude Opus 4.1 | |||||||
| Claude Haiku 4.5 | |||||||
| Claude Opus 4 | |||||||
| Claude Sonnet 4 | |||||||
| Claude 3.7 Sonnet di Anthropic | |||||||
| Claude 3.5 Haiku di Anthropic | |||||||
| Claude 3 Haiku di Anthropic | |||||||
| Modelli Mistral | |||||||
| Mistral Medium 3 | |||||||
| Mistral OCR (25/05) | |||||||
| Mistral Small 3.1 (25.03) | |||||||
| Mistral Large (24:07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) | |||||||
Medio Oriente
| Tel Aviv(me-west1) | Doha(me-central1) | Dammam(me-central2) | |
|---|---|---|---|
| Modelli Anthropic | |||
| Claude Opus 4.6 | |||
| Claude Opus 4.5 | |||
| Claude Sonnet 4.5 | |||
| Claude Opus 4.1 | |||
| Claude Haiku 4.5 | |||
| Claude Opus 4 | |||
| Claude Sonnet 4 | |||
| Claude 3.7 Sonnet di Anthropic | |||
| Claude 3.5 Haiku di Anthropic | |||
| Claude 3 Haiku di Anthropic | |||
| Modelli Mistral | |||
| Mistral Medium 3 | |||
| Mistral OCR (25/05) | |||
| Mistral Small 3.1 (25.03) | |||
| Mistral Large (24:07) | |||
| Codestral 2 | |||
| Codestral (24.05) | |||
Google Cloud posizioni degli endpoint del modello aperto
Google gestisce le richieste dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di più, consulta la sezione "Endpoint regionali e globali" in Vertex AI open models for MaaS.
Gli endpoint dei modelli aperti per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:
Globale
| Globale(globale) | |
|---|---|
| Modelli Deepseek | |
DeepSeek-OCR
(deepseek-ocr-maas)
|
|
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|
| Modelli ZAI.org | |
GLM 4.7
(glm-4.7-maas)
|
|
GLM 5
(glm-5-maas)
|
|
| Modelli OpenAI | |
gpt-oss 120B
(gpt-oss-120b-maas)
|
|
gpt-oss 20B
(gpt-oss-20b-maas)
|
|
| Modelli di Moonshot AI | |
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|
| Modelli di Llama | |
| Llama 3.3 70B | |
| Llama 4 Maverick 17B-128E | |
| Llama 4 Scout 17B-16E | |
| Modelli MiniMax | |
MiniMax M2
(minimax-m2-maas)
|
|
| Modelli Qwen | |
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|
| Modelli e5 | |
Multilingual E5 Small
(multilingual-e5-small-maas)
|
|
Multilingual E5 Large
(multilingual-e5-large-instruct-maas)
|
|
Stati Uniti
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | Carolina del Sud(us-east1) | N. Virginia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Modelli Deepseek | |||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||||||
| Modelli ZAI.org | |||||||
GLM 4.7
(glm-4.7-maas)
|
|||||||
GLM 5
(glm-5-maas)
|
|||||||
| Modelli OpenAI | |||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||||||
| Modelli di Moonshot AI | |||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||||||
| Modelli di Llama | |||||||
| Llama 3.3 70B | |||||||
| Llama 4 Maverick 17B-128E | |||||||
| Llama 4 Scout 17B-16E | |||||||
| Modelli MiniMax | |||||||
MiniMax M2
(minimax-m2-maas)
|
|||||||
| Modelli Qwen | |||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||||||
| Modelli e5 | |||||||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
|||||||
Multilingual E5 Large
(multilingual-e5-large-instruct-maas)
|
|||||||
Americhe
| Montréal(northamerica-northeast1) | San Paolo(southamerica-east1) | |
|---|---|---|
| Modelli Deepseek | ||
DeepSeek-OCR
(deepseek-ocr-maas)
|
||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
||
| Modelli ZAI.org | ||
GLM 4.7
(glm-4.7-maas)
|
||
GLM 5
(glm-5-maas)
|
||
| Modelli OpenAI | ||
gpt-oss 120B
(gpt-oss-120b-maas)
|
||
gpt-oss 20B
(gpt-oss-20b-maas)
|
||
| Modelli di Moonshot AI | ||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
||
| Modelli di Llama | ||
| Llama 3.3 70B | ||
| Llama 4 Maverick 17B-128E | ||
| Llama 4 Scout 17B-16E | ||
| Modelli MiniMax | ||
MiniMax M2
(minimax-m2-maas)
|
||
| Modelli Qwen | ||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
||
| Modelli e5 | ||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
||
Multilingual E5 Large
(multilingual-e5-large-instruct-maas)
|
||
Europa
| Londra(europe-west2) | Belgio(europe-west1) | Paesi Bassi(europe-west4) | Zurigo(europe-west6) | Francoforte(europe-west3) | Finlandia(europe-north1) | Varsavia(europe-central2) | Milano(europe-west8) | Madrid(europe-southwest1) | Parigi(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Modelli Deepseek | ||||||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
||||||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
||||||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
||||||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
||||||||||
| Modelli ZAI.org | ||||||||||
GLM 4.7
(glm-4.7-maas)
|
||||||||||
GLM 5
(glm-5-maas)
|
||||||||||
| Modelli OpenAI | ||||||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
||||||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
||||||||||
| Modelli di Moonshot AI | ||||||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
||||||||||
| Modelli di Llama | ||||||||||
| Llama 3.3 70B | ||||||||||
| Llama 4 Maverick 17B-128E | ||||||||||
| Llama 4 Scout 17B-16E | ||||||||||
| Modelli MiniMax | ||||||||||
MiniMax M2
(minimax-m2-maas)
|
||||||||||
| Modelli Qwen | ||||||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
||||||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
||||||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
||||||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
||||||||||
| Modelli e5 | ||||||||||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
||||||||||
Multilingual E5 Large
(multilingual-e5-large-instruct-maas)
|
||||||||||
Asia Pacifico
| Mumbai(asia-south1) | Singapore(asia-southeast1) | Hong Kong(asia-east2) | Taiwan(asia-east1) | Tokyo(asia-northeast1) | Sydney(australia-southeast1) | Seul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Modelli Deepseek | |||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||||||
| Modelli ZAI.org | |||||||
GLM 4.7
(glm-4.7-maas)
|
|||||||
GLM 5
(glm-5-maas)
|
|||||||
| Modelli OpenAI | |||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||||||
| Modelli di Moonshot AI | |||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||||||
| Modelli di Llama | |||||||
| Llama 3.3 70B | |||||||
| Llama 4 Maverick 17B-128E | |||||||
| Llama 4 Scout 17B-16E | |||||||
| Modelli MiniMax | |||||||
MiniMax M2
(minimax-m2-maas)
|
|||||||
| Modelli Qwen | |||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||||||
| Modelli e5 | |||||||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
|||||||
Multilingual E5 Large
(multilingual-e5-large-instruct-maas)
|
|||||||
Medio Oriente
| Tel Aviv(me-west1) | Doha(me-central1) | Dammam(me-central2) | |
|---|---|---|---|
| Modelli Deepseek | |||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||
| Modelli ZAI.org | |||
GLM 4.7
(glm-4.7-maas)
|
|||
GLM 5
(glm-5-maas)
|
|||
| Modelli OpenAI | |||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||
| Modelli di Moonshot AI | |||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||
| Modelli di Llama | |||
| Llama 3.3 70B | |||
| Llama 4 Maverick 17B-128E | |||
| Llama 4 Scout 17B-16E | |||
| Modelli MiniMax | |||
MiniMax M2
(minimax-m2-maas)
|
|||
| Modelli Qwen | |||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||
| Modelli e5 | |||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
|||
Multilingual E5 Large
(multilingual-e5-large-instruct-maas)
|
|||
Passaggi successivi
- Scopri di più sulla residenza dei dati dell'AI generativa su Vertex AI.
- Scopri di più sulle regioniGoogle Cloud .
- Scopri di più sui controlli di sicurezza per funzionalità.
- Scopri di più sui modelli che forniscono il supporto dell'IA generativa su Vertex AI. Consulta il riferimento al modello di base di AI generativa.
- Scopri di più sulle località di Vertex AI.