Implantações e endpoints

Os modelos do Google e dos parceiros e os recursos de IA generativa na Vertex AI são expostos como endpoints regionais específicos e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que as regiões únicas.

Endpoint global

Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de recurso esgotado (429). Não use o endpoint global se você tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.

Modelos compatíveis

O uso do endpoint global é compatível com os seguintes modelos do Google nas regiões especificadas. Para detalhes sobre quais regiões oferecem suporte ao endpoint global, consulte a guia Global na tabela de locais de endpoints de modelos do Google.

Para informações sobre a disponibilidade global de endpoints para modelos de parceiros, consulte a guia Global na tabela de locais de endpoints de modelos de parceiros doGoogle Cloud .

Usar o endpoint global

Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global. Por exemplo, o seguinte é um URL de endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK da IA generativa do Google, crie um cliente que use o local global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Para o SDK da Vertex AI para Python, inicialize o SDK usando o local global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitações

Os seguintes recursos não estão disponíveis ao usar o endpoint global:

Ajuste
Previsão em lote para modelos da Anthropic e do OpenMaaS
Corpus de geração aumentada por recuperação (RAG) (as solicitações de RAG são aceitas)

O uso do endpoint global com capacidade de processamento provisionada está disponível apenas para os seguintes modelos:

Modelo	Versão mais recente do modelo compatível
Gemini 3 Flash (pré-lançamento)	`gemini-3-flash-preview`
Gemini 3 Pro (pré-lançamento)	`gemini-3-pro-preview`
Imagem do Gemini 3 Pro (pré-lançamento)	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash (pré-lançamento)	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite (pré-lançamento)	`gemini-2.5-flash-lite-preview-09-2025`
Imagem do Gemini 2.5 Flash	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Locais de endpoints de modelos do Google

Os endpoints de modelo do Google para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões.

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Norte da Virgínia (us-east4)	Oregon (us-west1)
Gemini 3 Pro (`gemini-3-pro-preview`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-lançamento) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-lançamento) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (prévia) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (prévia) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento da TTS Lite do Gemini 2.5 Flash (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Canadá

	Montreal (northamerica-northeast1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento da TTS Lite do Gemini 2.5 Flash (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Brasil

	São Paulo (southamerica-east1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento da TTS Lite do Gemini 2.5 Flash (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Europa

	Países Baixos (europe-west4)	Paris, França (europe-west9)	Londres, Reino Unido (europe-west2)	Frankfurt, Alemanha (europe-west3)	Bélgica (europe-west1)	Zurique, Suíça (europe-west6)	Madri, Espanha (europe-southwest1)	Milão, Itália (europe-west8)	Finlândia (europe-north1)	Varsóvia, Polônia (europe-central2)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento da TTS Lite do Gemini 2.5 Flash (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Ásia-Pacífico

	Tóquio, Japão (asia-northeast1)	Sydney, Austrália (australia-southeast1)	Singapura (asia-southeast1)	Seul, Coreia (asia-northeast3)	Taiwan (asia-east1)	Hong Kong, China (asia-east2)	Mumbai, Índia (asia-south1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento da TTS Lite do Gemini 2.5 Flash (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Oriente Médio

	Damã, Arábia Saudita (me-central2)	Doha, Catar (me-central1)	Tel Aviv, Israel (me-west1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento da TTS Lite do Gemini 2.5 Flash (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Global

	Global (global)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Criação de Imagens do Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Embeddings do Gemini (`gemini-embedding-001`)
Embeddings para texto
Embeddings para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Pré-lançamento da TTS Lite do Gemini 2.5 Flash (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Google Cloud locais de endpoints de modelos de parceiros

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros da Vertex AI para MaaS.

Os endpoints de modelos de parceiros para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Norte da Virgínia (us-east4)	Oregon (us-west1)
Claude Opus 4.5 da Anthropic
Anthropic Claude Sonnet 4.5
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

	Países Baixos (europe-west4)	Bélgica (europe-west1)
Claude Opus 4.5 da Anthropic
Anthropic Claude Sonnet 4.5
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5
Claude Opus 4 da Anthropic
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Ásia-Pacífico

	Singapura (asia-southeast1)	Taiwan (asia-east1)
Claude Opus 4.5 da Anthropic
Anthropic Claude Sonnet 4.5
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

	Global (global)
Claude Opus 4.5 da Anthropic
Anthropic Claude Sonnet 4.5
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud locais de endpoints de modelos abertos

Os endpoints de modelos abertos para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Norte da Virgínia (us-east4)	Oregon (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-lançamento)
Llama 3.1 70B (pré-lançamento)
Llama 3.1 405B
Llama 3.2 90B (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

	Países Baixos (europe-west4)	Bélgica (europe-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-lançamento)
Llama 3.1 70B (pré-lançamento)
Llama 3.1 405B
Llama 3.2 90B (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Ásia-Pacífico

	Singapura (asia-southeast1)	Taiwan (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-lançamento)
Llama 3.1 70B (pré-lançamento)
Llama 3.1 405B
Llama 3.2 90B (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Global

	Global (global)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-lançamento)
Llama 3.1 70B (pré-lançamento)
Llama 3.1 405B
Llama 3.2 90B (pré-lançamento)
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

A seguir

Para um tutorial em notebook que demonstra o endpoint global, consulte Introdução ao endpoint global da Vertex AI.
Saiba mais sobre a residência de dados da IA generativa na Vertex AI.
Saiba mais sobre as regiões doGoogle Cloud .
Saiba mais sobre os controles de segurança por recurso.
Saiba mais sobre os modelos que oferecem suporte à IA generativa na Vertex AI. Consulte Referência do modelo de fundação da IA generativa.
Saiba mais sobre os locais da Vertex AI.

Implantações e endpoints Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Endpoint global

Modelos compatíveis

Usar o endpoint global

Limitações

Locais de endpoints de modelos do Google

Estados Unidos

Canadá

Brasil

Europa

Ásia-Pacífico

Oriente Médio

Global

Google Cloud locais de endpoints de modelos de parceiros

Estados Unidos

Europa

Ásia-Pacífico

Global

Google Cloud locais de endpoints de modelos abertos

Estados Unidos

Europa

Ásia-Pacífico

Global

A seguir

Implantações e endpoints