Implantações e endpoints

Os modelos do Google e dos parceiros e os recursos de IA generativa na Vertex AI são expostos como endpoints regionais específicos e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que as regiões únicas.

Endpoint global

Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de recurso esgotado (429). Não use o endpoint global se você tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.

Modelos compatíveis

O uso do endpoint global é compatível com os seguintes modelos do Google nas regiões especificadas. Para saber quais regiões oferecem suporte ao endpoint global, consulte a guia Global na tabela de locais de endpoints de modelos do Google.

Para informações sobre a disponibilidade global de endpoints para modelos de parceiros, consulte a guia Global na tabela de locais de endpoints de modelos de parceiros doGoogle Cloud .

Usar o endpoint global

Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global. Por exemplo, o seguinte é um URL de endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK da IA generativa do Google, crie um cliente que use o local global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Para o SDK da Vertex AI para Python, inicialize o SDK usando o local global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitações

Os seguintes recursos não estão disponíveis ao usar o endpoint global:

Ajuste
Previsão em lote para modelos da Anthropic e do OpenMaaS
Corpus de geração aumentada por recuperação (RAG) (as solicitações de RAG são aceitas)

O uso do endpoint global com capacidade de processamento provisionada está disponível apenas para os seguintes modelos:

Clique para ver os modelos compatíveis com o endpoint global ao usar a capacidade de processamento provisionada

Modelo	Versão mais recente do modelo com suporte
Gemini 3 Flash pré-lançamento	`gemini-3-flash-preview`
Gemini 3 Pro pré-lançamento	`gemini-3-pro-preview`
Imagem do Gemini 3 Pro pré-lançamento	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash pré-lançamento	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite pré-lançamento	`gemini-2.5-flash-lite-preview-09-2025`
Criação de Imagens do Gemini 2.5 Flash	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash Lite	`gemini-2.0-flash-lite-001`

Locais de endpoints de modelos do Google

Os modelos do Google na Vertex AI estão disponíveis para os seguintes endpoints:

Global

	Global(global)
Modelos do Gemini
Gemini 3 Flash pré-lançamento `(gemini-3-flash-preview)`
Gemini 3 Pro pré-lançamento `(gemini-3-pro-preview)`
Gemini 3 Pro Image pré-lançamento `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash pré-lançamento `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite pré-lançamento `(gemini-2.5-flash-lite-preview-09-2025)`
Criação de Imagens do Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live pré-lançamento `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash com a API Gemini Live pré-lançamento `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Embeddings do Gemini `(gemini-embeddings-001)`
Embeddings para texto
Embeddings para multimodal
Modelos da Imagen na Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personalização controlada do Imagen 3 `(imagen-3.0-capability-001)`
Imagem 4 `(imagen-4.0-generate-001)`
Imagem 4 `(imagen-4.0-fast-generate-001)`
Geração do Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modelos do Veo na Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Geração do Veo 2 prévia `(veo-2.0-generate-exp)`
Geração do Veo 2 prévia `(veo-2.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-fast-generate-preview)`
Geração do Veo 3 `(veo-3.0-generate-001)`
Geração rápida do Veo 3 `(veo-3.0-fast-generate-001)`
Veo 3.1 Gerar prévia `(veo-3.1-generate-preview)`
Geração rápida do Veo 3.1 prévia `(veo-3.1-fast-generate-preview)`
Geração do Veo 3.1 `(veo-3.1-generate-001)`
Geração rápida do Veo 3.1 `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição `(chirp_3)`
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Pré-lançamento do Gemini 2.5 Flash Lite TTS pré-lançamento `(gemini-2.5-flash-lite-preview-tts)`

Estados Unidos

	Oregon(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina do Sul(us-east1)	N. Virgínia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos do Gemini
Gemini 3 Flash pré-lançamento `(gemini-3-flash-preview)`
Gemini 3 Pro pré-lançamento `(gemini-3-pro-preview)`
Gemini 3 Pro Image pré-lançamento `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash pré-lançamento `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite pré-lançamento `(gemini-2.5-flash-lite-preview-09-2025)`
Criação de Imagens do Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live pré-lançamento `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash com a API Gemini Live pré-lançamento `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Embeddings do Gemini `(gemini-embeddings-001)`
Embeddings para texto
Embeddings para multimodal
Modelos da Imagen na Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personalização controlada do Imagen 3 `(imagen-3.0-capability-001)`
Imagem 4 `(imagen-4.0-generate-001)`
Imagem 4 `(imagen-4.0-fast-generate-001)`
Geração do Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modelos do Veo na Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Geração do Veo 2 prévia `(veo-2.0-generate-exp)`
Geração do Veo 2 prévia `(veo-2.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-fast-generate-preview)`
Geração do Veo 3 `(veo-3.0-generate-001)`
Geração rápida do Veo 3 `(veo-3.0-fast-generate-001)`
Veo 3.1 Gerar prévia `(veo-3.1-generate-preview)`
Geração rápida do Veo 3.1 prévia `(veo-3.1-fast-generate-preview)`
Geração do Veo 3.1 `(veo-3.1-generate-001)`
Geração rápida do Veo 3.1 `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição `(chirp_3)`
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Pré-lançamento do Gemini 2.5 Flash Lite TTS pré-lançamento `(gemini-2.5-flash-lite-preview-tts)`

Américas

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos do Gemini
Gemini 3 Flash pré-lançamento `(gemini-3-flash-preview)`
Gemini 3 Pro pré-lançamento `(gemini-3-pro-preview)`
Gemini 3 Pro Image pré-lançamento `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash pré-lançamento `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite pré-lançamento `(gemini-2.5-flash-lite-preview-09-2025)`
Criação de Imagens do Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live pré-lançamento `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash com a API Gemini Live pré-lançamento `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Embeddings do Gemini `(gemini-embeddings-001)`
Embeddings para texto
Embeddings para multimodal
Modelos da Imagen na Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personalização controlada do Imagen 3 `(imagen-3.0-capability-001)`
Imagem 4 `(imagen-4.0-generate-001)`
Imagem 4 `(imagen-4.0-fast-generate-001)`
Geração do Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modelos do Veo na Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Geração do Veo 2 prévia `(veo-2.0-generate-exp)`
Geração do Veo 2 prévia `(veo-2.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-fast-generate-preview)`
Geração do Veo 3 `(veo-3.0-generate-001)`
Geração rápida do Veo 3 `(veo-3.0-fast-generate-001)`
Veo 3.1 Gerar prévia `(veo-3.1-generate-preview)`
Geração rápida do Veo 3.1 prévia `(veo-3.1-fast-generate-preview)`
Geração do Veo 3.1 `(veo-3.1-generate-001)`
Geração rápida do Veo 3.1 `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição `(chirp_3)`
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Pré-lançamento do Gemini 2.5 Flash Lite TTS pré-lançamento `(gemini-2.5-flash-lite-preview-tts)`

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Baixos(europe-west4)	Zurique(europe-west6)	Frankfurt(europe-west3)	Finlândia(europe-north1)	Varsóvia(europe-central2)	Milão(europe-west8)	Madri(europe-southwest1)	Paris(europe-west9)
Modelos do Gemini
Gemini 3 Flash pré-lançamento `(gemini-3-flash-preview)`
Gemini 3 Pro pré-lançamento `(gemini-3-pro-preview)`
Gemini 3 Pro Image pré-lançamento `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash pré-lançamento `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite pré-lançamento `(gemini-2.5-flash-lite-preview-09-2025)`
Criação de Imagens do Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live pré-lançamento `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash com a API Gemini Live pré-lançamento `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Embeddings do Gemini `(gemini-embeddings-001)`
Embeddings para texto
Embeddings para multimodal
Modelos da Imagen na Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personalização controlada do Imagen 3 `(imagen-3.0-capability-001)`
Imagem 4 `(imagen-4.0-generate-001)`
Imagem 4 `(imagen-4.0-fast-generate-001)`
Geração do Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modelos do Veo na Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Geração do Veo 2 prévia `(veo-2.0-generate-exp)`
Geração do Veo 2 prévia `(veo-2.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-fast-generate-preview)`
Geração do Veo 3 `(veo-3.0-generate-001)`
Geração rápida do Veo 3 `(veo-3.0-fast-generate-001)`
Veo 3.1 Gerar prévia `(veo-3.1-generate-preview)`
Geração rápida do Veo 3.1 prévia `(veo-3.1-fast-generate-preview)`
Geração do Veo 3.1 `(veo-3.1-generate-001)`
Geração rápida do Veo 3.1 `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição `(chirp_3)`
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Pré-lançamento do Gemini 2.5 Flash Lite TTS pré-lançamento `(gemini-2.5-flash-lite-preview-tts)`

Ásia-Pacífico

	Mumbai(asia-south1)	Singapura(asia-southeast1)	Hong Kong(asia-east2)	Taiwan(asia-east1)	Tóquio(asia-northeast1)	Sydney(australia-southeast1)	Seul(asia-northeast3)
Modelos do Gemini
Gemini 3 Flash pré-lançamento `(gemini-3-flash-preview)`
Gemini 3 Pro pré-lançamento `(gemini-3-pro-preview)`
Gemini 3 Pro Image pré-lançamento `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash pré-lançamento `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite pré-lançamento `(gemini-2.5-flash-lite-preview-09-2025)`
Criação de Imagens do Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live pré-lançamento `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash com a API Gemini Live pré-lançamento `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Embeddings do Gemini `(gemini-embeddings-001)`
Embeddings para texto
Embeddings para multimodal
Modelos da Imagen na Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personalização controlada do Imagen 3 `(imagen-3.0-capability-001)`
Imagem 4 `(imagen-4.0-generate-001)`
Imagem 4 `(imagen-4.0-fast-generate-001)`
Geração do Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modelos do Veo na Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Geração do Veo 2 prévia `(veo-2.0-generate-exp)`
Geração do Veo 2 prévia `(veo-2.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-fast-generate-preview)`
Geração do Veo 3 `(veo-3.0-generate-001)`
Geração rápida do Veo 3 `(veo-3.0-fast-generate-001)`
Veo 3.1 Gerar prévia `(veo-3.1-generate-preview)`
Geração rápida do Veo 3.1 prévia `(veo-3.1-fast-generate-preview)`
Geração do Veo 3.1 `(veo-3.1-generate-001)`
Geração rápida do Veo 3.1 `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição `(chirp_3)`
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Pré-lançamento do Gemini 2.5 Flash Lite TTS pré-lançamento `(gemini-2.5-flash-lite-preview-tts)`

Oriente Médio

	Tel Aviv(me-west1)	Doha(me-central1)	Damã(me-central2)
Modelos do Gemini
Gemini 3 Flash pré-lançamento `(gemini-3-flash-preview)`
Gemini 3 Pro pré-lançamento `(gemini-3-pro-preview)`
Gemini 3 Pro Image pré-lançamento `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash pré-lançamento `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite pré-lançamento `(gemini-2.5-flash-lite-preview-09-2025)`
Criação de Imagens do Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash com áudio nativo da API Gemini Live pré-lançamento `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash com a API Gemini Live pré-lançamento `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Embeddings do Gemini `(gemini-embeddings-001)`
Embeddings para texto
Embeddings para multimodal
Modelos da Imagen na Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Personalização controlada do Imagen 3 `(imagen-3.0-capability-001)`
Imagem 4 `(imagen-4.0-generate-001)`
Imagem 4 `(imagen-4.0-fast-generate-001)`
Geração do Imagen 4 Ultra `(imagen-4.0-ultra-generate-001)`
Modelos do Veo na Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Geração do Veo 2 prévia `(veo-2.0-generate-exp)`
Geração do Veo 2 prévia `(veo-2.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-generate-preview)`
Geração do Veo 3 prévia `(veo-3.0-fast-generate-preview)`
Geração do Veo 3 `(veo-3.0-generate-001)`
Geração rápida do Veo 3 `(veo-3.0-fast-generate-001)`
Veo 3.1 Gerar prévia `(veo-3.1-generate-preview)`
Geração rápida do Veo 3.1 prévia `(veo-3.1-fast-generate-preview)`
Geração do Veo 3.1 `(veo-3.1-generate-001)`
Geração rápida do Veo 3.1 `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição `(chirp_3)`
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
Gemini 2.5 Flash TTS `(gemini-2.5-flash-tts)`
Pré-lançamento do Gemini 2.5 Flash Lite TTS pré-lançamento `(gemini-2.5-flash-lite-preview-tts)`

Google Cloud locais de endpoints de modelos de parceiros

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros da Vertex AI para MaaS.

Os endpoints de modelos de parceiros para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Global

	Global(global)
Modelos da Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Estados Unidos

	Oregon(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina do Sul(us-east1)	N. Virgínia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos da Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Américas

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos da Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Baixos(europe-west4)	Zurique(europe-west6)	Frankfurt(europe-west3)	Finlândia(europe-north1)	Varsóvia(europe-central2)	Milão(europe-west8)	Madri(europe-southwest1)	Paris(europe-west9)
Modelos da Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Ásia-Pacífico

	Mumbai(asia-south1)	Singapura(asia-southeast1)	Hong Kong(asia-east2)	Taiwan(asia-east1)	Tóquio(asia-northeast1)	Sydney(australia-southeast1)	Seul(asia-northeast3)
Modelos da Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet, da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Oriente Médio

	Tel Aviv(me-west1)	Doha(me-central1)	Damã(me-central2)
Modelos da Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud locais de endpoints de modelos abertos

Os endpoints de modelos abertos para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Global

	Global(global)
Modelos DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos do ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos da OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos da Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 Large multilíngue `(multilingual-e5-large-instruct-maas)`

Estados Unidos

	Oregon(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina do Sul(us-east1)	N. Virgínia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos do ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos da OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos da Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 Large multilíngue `(multilingual-e5-large-instruct-maas)`

Américas

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos do ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos da OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos da Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 Large multilíngue `(multilingual-e5-large-instruct-maas)`

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Baixos(europe-west4)	Zurique(europe-west6)	Frankfurt(europe-west3)	Finlândia(europe-north1)	Varsóvia(europe-central2)	Milão(europe-west8)	Madri(europe-southwest1)	Paris(europe-west9)
Modelos DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos do ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos da OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos da Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 Large multilíngue `(multilingual-e5-large-instruct-maas)`

Ásia-Pacífico

	Mumbai(asia-south1)	Singapura(asia-southeast1)	Hong Kong(asia-east2)	Taiwan(asia-east1)	Tóquio(asia-northeast1)	Sydney(australia-southeast1)	Seul(asia-northeast3)
Modelos DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos do ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos da OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos da Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 Large multilíngue `(multilingual-e5-large-instruct-maas)`

Oriente Médio

	Tel Aviv(me-west1)	Doha(me-central1)	Damã(me-central2)
Modelos DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos do ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos da OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos da Moonshot AI
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 Large multilíngue `(multilingual-e5-large-instruct-maas)`

A seguir

Saiba mais sobre a residência de dados da IA generativa na Vertex AI.
Saiba mais sobre as regiões doGoogle Cloud .
Saiba mais sobre os controles de segurança por recurso.
Saiba mais sobre os modelos que oferecem suporte à IA generativa na Vertex AI. Consulte Referência do modelo de fundação da IA generativa.
Saiba mais sobre os locais da Vertex AI.

Implantações e endpoints Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Endpoint global

Modelos compatíveis

Usar o endpoint global

Limitações

Clique para ver os modelos compatíveis com o endpoint global ao usar a capacidade de processamento provisionada

Locais de endpoints de modelos do Google

Global

Estados Unidos

Américas

Europa

Ásia-Pacífico

Oriente Médio

Google Cloud locais de endpoints de modelos de parceiros

Global

Estados Unidos

Américas

Europa

Ásia-Pacífico

Oriente Médio

Google Cloud locais de endpoints de modelos abertos

Global

Estados Unidos

Américas

Europa

Ásia-Pacífico

Oriente Médio

A seguir

Implantações e endpoints