I modelli e le funzionalità di AI generativa di Google e dei partner su Vertex AI sono esposti come endpoint regionali specifici e un endpoint globale. Gli endpoint globali coprono il mondo intero e offrono disponibilità e affidabilità superiori rispetto alle singole regioni.
Tieni presente che gli endpoint del modello non garantiscono la disponibilità della regione o l'elaborazione ML nella regione. Per informazioni sulla residenza dei dati, consulta Residenza dei dati.
Endpoint globale
Selezionare un endpoint globale per le richieste può migliorare la disponibilità complessiva riducendo gli errori di esaurimento delle risorse (429). Non utilizzare l'endpoint globale se hai requisiti di elaborazione ML, perché non puoi controllare o sapere a quale regione vengono inviate le tue richieste di elaborazione ML quando viene effettuata una richiesta.
Modelli supportati
L'utilizzo dell'endpoint globale è supportato per i seguenti modelli Google nelle regioni specificate. Per informazioni dettagliate sulle regioni che supportano l'endpoint globale, consulta la scheda Globale nella tabella delle località degli endpoint dei modelli Google.
- Gemini 2.5 Flash (anteprima)
- Gemini 2.5 Flash-Lite (anteprima)
- Gemini 2.5 Flash Image
- Gemini 2.5 Flash-Lite
- Gemini 2.0 Flash con generazione di immagini (anteprima)
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Per informazioni sulla disponibilità degli endpoint globali per i modelli partner, consulta la scheda Globale nella Google Cloud tabella delle posizioni degli endpoint del modello partner.
Utilizzare l'endpoint globale
Per utilizzare l'endpoint globale, escludi la località dal nome dell'endpoint e
configura la località della risorsa su global
. Ad esempio, il seguente
è l'URL dell'endpoint globale:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Per l'SDK Google Gen AI, crea un client che utilizzi la località global
:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Per SDK Vertex AI Python,
inizializza l'SDK utilizzando la località global
:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitazioni
Le seguenti funzionalità non sono disponibili quando utilizzi l'endpoint globale:
- Ottimizzazione
- Previsione batch
- Corpus di Retrieval-Augmented Generation (RAG) (le richieste RAG sono supportate)
L'utilizzo dell'endpoint globale con il throughput riservato è disponibile solo per i seguenti modelli:
Modello | Ultima versione del modello supportata |
---|---|
Gemini 2.5 Flash (anteprima) | gemini-2.5-flash-preview-09-2025 |
Gemini 2.5 Flash-Lite (anteprima) | gemini-2.5-flash-lite-preview-09-2025 |
Gemini 2.5 Flash Image | gemini-2.5-flash-image |
Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Posizioni degli endpoint dei modelli Google
Gli endpoint dei modelli Google per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni.
Stati Uniti
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina del Sud (us-east1) | Virginia del Nord (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
|||||||
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio ) |
|||||||
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
|||||||
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Embeddings per il testo | |||||||
Incorporamenti per multimodale | |||||||
Imagen per la generazione di didascalie e VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
|||||||
Veo 2
( veo-2.0-generate-001 ) |
|||||||
Veo 3
( veo-3.0-generate-001 ) |
|||||||
Veo 3 Fast
( veo-3.0-fast-generate-001 ) |
|||||||
Veo 3 (anteprima)
( veo-3.0-generate-preview ) |
|||||||
Veo 3 Fast (anteprima)
( veo-3.0-fast-generate-preview ) |
|||||||
Chirp 3: Trascrizione (chirp_3 ) |
|||||||
Chirp 2: Trascrizione (chirp_2 ) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
|||||||
Chirp 3: voci in HD | |||||||
Chirp 3: voce personalizzata istantanea |
Canada
Montréal (northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio ) |
|
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings per il testo | |
Incorporamenti per multimodale | |
Imagen per la generazione di didascalie e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
|
Chirp 3: Trascrizione (chirp_3 ) |
|
Chirp 2: Trascrizione (chirp_2 ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
|
Chirp 3: voci in HD | |
Chirp 3: voce personalizzata istantanea |
Sud America
San Paolo, Brasile (southamerica-east1) | |
---|---|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio ) |
|
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings per il testo | |
Incorporamenti per multimodale | |
Imagen per la generazione di didascalie e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
|
Chirp 3: Trascrizione (chirp_3 ) |
|
Chirp 2: Trascrizione (chirp_2 ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
|
Chirp 3: voci in HD | |
Chirp 3: voce personalizzata istantanea |
Europa
Paesi Bassi (europe-west4) | Parigi, Francia (europe-west9) | Londra, Regno Unito (europe-west2) | Francoforte, Germania (europe-west3) | Belgio (europe-west1) | Zurigo, Svizzera (europe-west6) | Madrid, Spagna (europe-southwest1) | Milano, Italia (europe-west8) | Finlandia (europe-north1) | Varsavia, Polonia (europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
||||||||||
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio ) |
||||||||||
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
||||||||||
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | |||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings per il testo | ||||||||||
Incorporamenti per multimodale | ||||||||||
Imagen per la generazione di didascalie e VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3imagen-3.0-generate-002 |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
||||||||||
Chirp 3: Trascrizione (chirp_3 ) |
||||||||||
Chirp 2: Trascrizione (chirp_2 ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
||||||||||
Chirp 3: voci in HD | ||||||||||
Chirp 3: voce personalizzata istantanea |
Asia Pacifico
Tokyo, Giappone (asia-northeast1) | Sydney, Australia (australia-southeast1) | Singapore (asia-southeast1) | Seul, Corea (asia-northeast3) | Taiwan (asia-east1) | Hong Kong, Cina (asia-east2) | Mumbai, India (asia-south1) | ||||
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
||||||||||
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio ) |
||||||||||
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
||||||||||
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | * | * | |||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
* | |||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings per il testo | ||||||||||
Incorporamenti per multimodale | ||||||||||
Imagen per la generazione di didascalie e VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
||||||||||
Chirp 3: Trascrizione (chirp_3 ) |
||||||||||
Chirp 2: Trascrizione (chirp_2 ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
||||||||||
Chirp 3: voci in HD | ||||||||||
Chirp 3: voce personalizzata istantanea |
Medio Oriente
Dammam, Arabia Saudita (me-central2) | Doha, Qatar (me-central1) | Tel Aviv, Israele (me-west1) | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
||||||||||
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio ) |
||||||||||
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
||||||||||
Gemini 2.5 Flash ( gemini-2.5-flash ) |
||||||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings per il testo | ||||||||||
Incorporamenti per multimodale | ||||||||||
Imagen per la generazione di didascalie e VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
||||||||||
Chirp 3: Trascrizione (chirp_3 ) |
||||||||||
Chirp 2: Trascrizione (chirp_2 ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
||||||||||
Chirp 3: voci in HD | ||||||||||
Chirp 3: voce personalizzata istantanea |
Globale
Globale (globale) | |
---|---|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
|
Gemini 2.5 Flash con audio nativo dell'API Live ( gemini-live-2.5-flash-preview-native-audio ) |
|
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings per il testo | |
Incorporamenti per multimodale | |
Imagen per la generazione di didascalie e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Modifica e personalizzazione di Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate sperimentale
( imagen-4.0-ultra-generate-001 ) |
|
Chirp 3: Trascrizione (chirp_3 ) |
|
Chirp 2: Trascrizione (chirp_2 ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
|
Chirp 3: voci in HD | |
Chirp 3: voce personalizzata istantanea |
* La regione è disponibile solo quando utilizzi Single Zone Provisioned Throughput o la previsione batch e il perfezionamento supervisionato non sono supportati in questa regione.
Google Cloud posizioni degli endpoint del modello partner
Google gestisce le richieste provenienti dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per saperne di più, consulta la sezione "Endpoint regionali e globali" in Modelli partner di Vertex AI per MaaS.
Gli endpoint dei modelli partner per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:
Stati Uniti
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina del Sud (us-east1) | Virginia del Nord (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Claude Sonnet 4.5 di Anthropic | |||||||
Claude Opus 4.1 di Anthropic | |||||||
Claude Haiku 4.5 di Anthropic | |||||||
Claude Opus 4 di Anthropic | |||||||
Claude Sonnet 4 di Anthropic | |||||||
Claude 3.7 Sonnet di Anthropic | |||||||
Claude 3.5 Haiku di Anthropic | |||||||
Claude 3 Haiku di Anthropic | |||||||
Mistral Medium 3 | |||||||
OCR Mistral (25/05) | |||||||
Mistral Small 3.1 (25/03) | |||||||
Mistral Large (24:07) | |||||||
Codestral 2 | |||||||
Codestral (24.05) |
Europa
Paesi Bassi (europe-west4) | Belgio (europe-west1) | |
---|---|---|
Claude Sonnet 4.5 di Anthropic | ||
Claude Opus 4.1 di Anthropic | ||
Claude Haiku 4.5 | ||
Claude Opus 4 di Anthropic | ||
Claude Sonnet 4 di Anthropic | ||
Claude 3.7 Sonnet di Anthropic | ||
Claude 3.5 Haiku di Anthropic | ||
Claude 3 Haiku di Anthropic | ||
Mistral Medium 3 | ||
OCR Mistral (25/05) | ||
Mistral Small 3.1 (25/03) | ||
Mistral Large (24:07) | ||
Codestral 2 | ||
Codestral (24.05) |
Asia Pacifico
Singapore (asia-southeast1) | Taiwan (asia-east1) | |
---|---|---|
Claude Sonnet 4.5 di Anthropic | ||
Claude Opus 4.1 di Anthropic | ||
Claude Haiku 4.5 di Anthropic | ||
Claude Opus 4 di Anthropic | ||
Claude Sonnet 4 di Anthropic | ||
Claude 3.7 Sonnet di Anthropic | ||
Claude 3.5 Haiku di Anthropic | ||
Claude 3 Haiku di Anthropic | ||
Mistral Medium 3 | ||
OCR Mistral (25/05) | ||
Mistral Small 3.1 (25/03) | ||
Mistral Large (24:07) | ||
Codestral 2 | ||
Codestral (24.05) |
Globale
Globale (globale) | ||
---|---|---|
Claude Sonnet 4.5 di Anthropic | ||
Claude Opus 4.1 di Anthropic | ||
Claude Haiku 4.5 di Anthropic | ||
Claude Opus 4 di Anthropic | ||
Claude Sonnet 4 di Anthropic | ||
Claude 3.7 Sonnet di Anthropic | ||
Claude 3.5 Haiku di Anthropic | ||
Claude 3 Haiku di Anthropic | ||
Mistral Medium 3 | ||
OCR Mistral (25/05) | ||
Mistral Small 3.1 (25/03) | ||
Mistral Large (24:07) | ||
Codestral 2 | ||
Codestral (24.05) |
Google Cloud posizioni degli endpoint del modello aperto
Google gestisce le richieste provenienti dalla regione che hai specificato. Per alcuni modelli, Google offre anche un endpoint globale per migliorare la disponibilità complessiva e ridurre i tassi di errore. L'endpoint globale può avere un insieme separato di quote rispetto all'endpoint regionale e non supporta i requisiti di residenza dei dati. Per maggiori informazioni, consulta la sezione "Endpoint regionali e globali" in Vertex AI open models per MaaS.
Gli endpoint dei modelli aperti per l'AI generativa su Vertex AI sono disponibili nelle seguenti regioni:
Stati Uniti
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina del Sud (us-east1) | Virginia del Nord (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
DeepSeek R1 (0528) | |||||||
Llama 4 Maverick 17B-128E (anteprima) | |||||||
Llama 4 Scout 17B-16E (anteprima) | |||||||
Llama 3.3 70B (anteprima) | |||||||
Llama 3.2 90B (anteprima) | |||||||
Llama 3.1 405B | |||||||
Llama 3.1 70B (anteprima) | |||||||
Llama 3.1 8B (anteprima) | |||||||
Multilingual E5 Small | |||||||
Multilingue E5 Large |
Europa
Paesi Bassi (europe-west4) | Belgio (europe-west1) | ||
---|---|---|---|
DeepSeek R1 (0528) | |||
Llama 4 Maverick 17B-128E (anteprima) | |||
Llama 4 Scout 17B-16E (anteprima) | |||
Llama 3.3 70B (anteprima) | |||
Llama 3.2 90B (anteprima) | |||
Llama 3.1 405B | |||
Llama 3.1 70B (anteprima) | |||
Llama 3.1 8B (anteprima) | |||
Multilingual E5 Small | |||
Multilingue E5 Large |
Asia Pacifico
Singapore (asia-southeast1) | Taiwan (asia-east1) | |
---|---|---|
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E (anteprima) | ||
Llama 4 Scout 17B-16E (anteprima) | ||
Llama 3.3 70B (anteprima) | ||
Llama 3.2 90B (anteprima) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (anteprima) | ||
Llama 3.1 8B (anteprima) |
Globale
Globale (globale) | |
---|---|
DeepSeek R1 (0528) | |
Llama 4 Maverick 17B-128E (anteprima) | |
Llama 4 Scout 17B-16E (anteprima) | |
Llama 3.3 70B (anteprima) | |
Llama 3.2 90B (anteprima) | |
Llama 3.1 405B | |
Llama 3.1 70B (anteprima) | |
Llama 3.1 8B (anteprima) |
Passaggi successivi
- Per un tutorial sui notebook che mostra l'endpoint globale, consulta Introduzione all'endpoint globale Vertex AI.
- Scopri di più sulla residenza dei dati dell'AI generativa su Vertex AI.
- Scopri di più sulle regioni diGoogle Cloud .
- Scopri di più sui controlli di sicurezza per funzionalità.
- Scopri di più sui modelli che forniscono il supporto dell'IA generativa su Vertex AI. Consulta il riferimento al modello di base di AI generativa.
- Scopri di più sulle località di Vertex AI.