Implantações e endpoints

Os modelos do Google e dos parceiros e os recursos de IA generativa na Vertex AI são expostos como endpoints regionais específicos e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que as regiões únicas.

Endpoint global

Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de recurso esgotado (429). Não use o endpoint global se você tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.

Modelos compatíveis

O uso do endpoint global é compatível com os seguintes modelos do Google nas regiões especificadas. Para saber quais regiões oferecem suporte ao endpoint global, consulte a guia Global na tabela de locais de endpoints de modelos do Google.

Para informações sobre a disponibilidade global de endpoints para modelos de parceiros, consulte a guia Global na tabela de locais de endpoints de modelos de parceiros doGoogle Cloud .

Usar o endpoint global

Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global. Por exemplo, o seguinte é um URL de endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK da IA generativa do Google, crie um cliente que use o local global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Para o SDK da Vertex AI para Python, inicialize o SDK usando o local global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitações

Os seguintes recursos não estão disponíveis ao usar o endpoint global:

Ajuste
Previsão em lote para modelos da Anthropic e do OpenMaaS
Corpus de geração aumentada por recuperação (RAG) (as solicitações de RAG são aceitas)

O uso do endpoint global com capacidade de processamento provisionada está disponível apenas para os seguintes modelos:

Modelo	Versão mais recente do modelo compatível
Gemini 3 Flash (pré-lançamento)	`gemini-3-flash-preview`
Gemini 3 Pro (pré-lançamento)	`gemini-3-pro-preview`
Imagem do Gemini 3 Pro (pré-lançamento)	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash (pré-lançamento)	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite (pré-lançamento)	`gemini-2.5-flash-lite-preview-09-2025`
Imagem do Gemini 2.5 Flash	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Locais de endpoints de modelos do Google

Os endpoints de modelos do Google para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões.

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Norte da Virgínia (us-east4)	Oregon (us-west1)
Gemini 3 Pro (`gemini-3-pro-preview`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-lançamento) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-lançamento) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (prévia) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (prévia) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento do Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Canadá

	Montreal (northamerica-northeast1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-lançamento) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-lançamento) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (prévia) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (prévia) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento do Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Brasil

	São Paulo (southamerica-east1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-lançamento) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-lançamento) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (prévia) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (prévia) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento do Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Europa

	Países Baixos (europe-west4)	Paris, França (europe-west9)	Londres, Reino Unido (europe-west2)	Frankfurt, Alemanha (europe-west3)	Bélgica (europe-west1)	Zurique, Suíça (europe-west6)	Madri, Espanha (europe-southwest1)	Milão, Itália (europe-west8)	Finlândia (europe-north1)	Varsóvia, Polônia (europe-central2)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-lançamento) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-lançamento) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (prévia) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (prévia) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento do Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Ásia-Pacífico

	Tóquio, Japão (asia-northeast1)	Sydney, Austrália (australia-southeast1)	Singapura (asia-southeast1)	Seul, Coreia (asia-northeast3)	Taiwan (asia-east1)	Hong Kong, China (asia-east2)	Mumbai, Índia (asia-south1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-lançamento) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-lançamento) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (prévia) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (prévia) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento do Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Oriente Médio

	Damã, Arábia Saudita (me-central2)	Doha, Catar (me-central1)	Tel Aviv, Israel (me-west1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-lançamento) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-lançamento) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (prévia) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (prévia) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento do Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Global

	Global (global)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-lançamento) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-lançamento) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (prévia) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (prévia) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento do Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Google Cloud locais de endpoints de modelos de parceiros

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros da Vertex AI para MaaS.

Os endpoints de modelos de parceiros para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Norte da Virgínia (us-east4)	Oregon (us-west1)
Claude Opus 4.6 da Anthropic
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5, da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4, da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

	Países Baixos (europe-west4)	Bélgica (europe-west1)
Claude Opus 4.6 da Anthropic
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5
Claude Opus 4 da Anthropic
Claude Sonnet 4, da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Ásia-Pacífico

	Singapura (asia-southeast1)	Taiwan (asia-east1)^*
Claude Opus 4.6 da Anthropic
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5, da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4, da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

	Global (global)
Claude Opus 4.6 da Anthropic
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5, da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4, da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

^* O suporte para essa região será descontinuado em 27 de fevereiro de 2025.

Google Cloud locais de endpoints de modelos abertos

Os endpoints de modelos abertos para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Norte da Virgínia (us-east4)	Oregon (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
GLM 5
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

	Países Baixos (europe-west4)	Bélgica (europe-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
GLM 5
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Ásia-Pacífico

	Singapura (asia-southeast1)	Taiwan (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
GLM 5
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Global

	Global (global)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
GLM 5
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

A seguir

Saiba mais sobre a residência de dados da IA generativa na Vertex AI.
Saiba mais sobre as regiões doGoogle Cloud .
Saiba mais sobre os controles de segurança por recurso.
Saiba mais sobre os modelos que oferecem suporte à IA generativa na Vertex AI. Consulte Referência do modelo de fundação da IA generativa.
Saiba mais sobre os locais da Vertex AI.

Implantações e endpoints Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Endpoint global

Modelos compatíveis

Usar o endpoint global

Limitações

Locais de endpoints de modelos do Google

Estados Unidos

Canadá

Brasil

Europa

Ásia-Pacífico

Oriente Médio

Global

Google Cloud locais de endpoints de modelos de parceiros

Estados Unidos

Europa

Ásia-Pacífico

Global

Google Cloud locais de endpoints de modelos abertos

Estados Unidos

Europa

Ásia-Pacífico

Global

A seguir

Implantações e endpoints