Implantações e endpoints

Os modelos do Google e dos parceiros e os recursos de IA generativa na Vertex AI são expostos como endpoints regionais específicos e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que as regiões únicas.

Endpoint global

Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de recurso esgotado (429). Não use o endpoint global se você tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.

Modelos compatíveis

O uso do endpoint global é compatível com os seguintes modelos do Google nas regiões especificadas. Para saber quais regiões oferecem suporte ao endpoint global, consulte a guia Global na tabela de locais de endpoints de modelos do Google.

Para informações sobre a disponibilidade global de endpoints para modelos de parceiros, consulte a guia Global na tabela de locais de endpoints de modelos de parceiros doGoogle Cloud .

Usar o endpoint global

Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global. Por exemplo, o seguinte é um URL de endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK da IA generativa do Google, crie um cliente que use o local global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Para o SDK da Vertex AI para Python, inicialize o SDK usando o local global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitações

Os seguintes recursos não estão disponíveis ao usar o endpoint global:

  • Ajuste
  • Previsão em lote para modelos da Anthropic e do OpenMaaS
  • Corpus de geração aumentada por recuperação (RAG) (as solicitações de RAG são aceitas)

O uso do endpoint global com capacidade de processamento provisionada está disponível apenas para os seguintes modelos:

Modelo Versão mais recente do modelo compatível
Gemini 3 Flash (pré-lançamento) gemini-3-flash-preview
Gemini 3 Pro (pré-lançamento) gemini-3-pro-preview
Imagem do Gemini 3 Pro (pré-lançamento) gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash (pré-lançamento) gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite (pré-lançamento) gemini-2.5-flash-lite-preview-09-2025
Imagem do Gemini 2.5 Flash gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Locais de endpoints de modelos do Google

Os endpoints de modelos do Google para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões.

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina do Sul (us-east1) Norte da Virgínia (us-east4) Oregon (us-west1)
Gemini 3 Pro
(gemini-3-pro-preview)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embeddings do Gemini
(gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Geração experimental do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (pré-lançamento)
(veo-3.0-generate-preview)
Veo 3 Fast (pré-lançamento)
(veo-3.0-fast-generate-preview)
Veo 3.1
(veo-3.1-generate-001)
Veo 3.1 Fast
(veo-3.1-fast-generate-001)
Veo 3.1 (prévia)
(veo-3.1-generate-preview)
Veo 3.1 Fast (prévia)
(veo-3.1-fast-generate-preview)
Chirp 3: transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
Pré-lançamento do Gemini 2.5 Flash Lite TTS
(gemini-2.5-flash-lite-preview-tts)
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Canadá

Montreal (northamerica-northeast1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embeddings do Gemini
(gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Geração experimental do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (pré-lançamento)
(veo-3.0-generate-preview)
Veo 3 Fast (pré-lançamento)
(veo-3.0-fast-generate-preview)
Veo 3.1
(veo-3.1-generate-001)
Veo 3.1 Fast
(veo-3.1-fast-generate-001)
Veo 3.1 (prévia)
(veo-3.1-generate-preview)
Veo 3.1 Fast (prévia)
(veo-3.1-fast-generate-preview)
Chirp 3: transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
Pré-lançamento do Gemini 2.5 Flash Lite TTS
(gemini-2.5-flash-lite-preview-tts)
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Brasil

São Paulo (southamerica-east1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embeddings do Gemini
(gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Geração experimental do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (pré-lançamento)
(veo-3.0-generate-preview)
Veo 3 Fast (pré-lançamento)
(veo-3.0-fast-generate-preview)
Veo 3.1
(veo-3.1-generate-001)
Veo 3.1 Fast
(veo-3.1-fast-generate-001)
Veo 3.1 (prévia)
(veo-3.1-generate-preview)
Veo 3.1 Fast (prévia)
(veo-3.1-fast-generate-preview)
Chirp 3: transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
Pré-lançamento do Gemini 2.5 Flash Lite TTS
(gemini-2.5-flash-lite-preview-tts)
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Europa

Países Baixos (europe-west4) Paris, França (europe-west9) Londres, Reino Unido (europe-west2) Frankfurt, Alemanha (europe-west3) Bélgica (europe-west1) Zurique, Suíça (europe-west6) Madri, Espanha (europe-southwest1) Milão, Itália (europe-west8) Finlândia (europe-north1) Varsóvia, Polônia (europe-central2)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embeddings do Gemini
(gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Geração experimental do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (pré-lançamento)
(veo-3.0-generate-preview)
Veo 3 Fast (pré-lançamento)
(veo-3.0-fast-generate-preview)
Veo 3.1
(veo-3.1-generate-001)
Veo 3.1 Fast
(veo-3.1-fast-generate-001)
Veo 3.1 (prévia)
(veo-3.1-generate-preview)
Veo 3.1 Fast (prévia)
(veo-3.1-fast-generate-preview)
Chirp 3: transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
Pré-lançamento do Gemini 2.5 Flash Lite TTS
(gemini-2.5-flash-lite-preview-tts)
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Ásia-Pacífico

Tóquio, Japão (asia-northeast1) Sydney, Austrália (australia-southeast1) Singapura (asia-southeast1) Seul, Coreia (asia-northeast3) Taiwan (asia-east1) Hong Kong, China (asia-east2) Mumbai, Índia (asia-south1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embeddings do Gemini
(gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Geração experimental do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (pré-lançamento)
(veo-3.0-generate-preview)
Veo 3 Fast (pré-lançamento)
(veo-3.0-fast-generate-preview)
Veo 3.1
(veo-3.1-generate-001)
Veo 3.1 Fast
(veo-3.1-fast-generate-001)
Veo 3.1 (prévia)
(veo-3.1-generate-preview)
Veo 3.1 Fast (prévia)
(veo-3.1-fast-generate-preview)
Chirp 3: transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
Pré-lançamento do Gemini 2.5 Flash Lite TTS
(gemini-2.5-flash-lite-preview-tts)
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Oriente Médio

Damã, Arábia Saudita (me-central2) Doha, Catar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embeddings do Gemini
(gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Geração experimental do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (pré-lançamento)
(veo-3.0-generate-preview)
Veo 3 Fast (pré-lançamento)
(veo-3.0-fast-generate-preview)
Veo 3.1
(veo-3.1-generate-001)
Veo 3.1 Fast
(veo-3.1-fast-generate-001)
Veo 3.1 (prévia)
(veo-3.1-generate-preview)
Veo 3.1 Fast (prévia)
(veo-3.1-fast-generate-preview)
Chirp 3: transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
Pré-lançamento do Gemini 2.5 Flash Lite TTS
(gemini-2.5-flash-lite-preview-tts)
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Global

Global (global)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash)
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Embeddings do Gemini
(gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Geração experimental do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (pré-lançamento)
(veo-3.0-generate-preview)
Veo 3 Fast (pré-lançamento)
(veo-3.0-fast-generate-preview)
Veo 3.1
(veo-3.1-generate-001)
Veo 3.1 Fast
(veo-3.1-fast-generate-001)
Veo 3.1 (prévia)
(veo-3.1-generate-preview)
Veo 3.1 Fast (prévia)
(veo-3.1-fast-generate-preview)
Chirp 3: transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
Pré-lançamento do Gemini 2.5 Flash Lite TTS
(gemini-2.5-flash-lite-preview-tts)
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea

Google Cloud locais de endpoints de modelos de parceiros

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros da Vertex AI para MaaS.

Os endpoints de modelos de parceiros para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina do Sul (us-east1) Norte da Virgínia (us-east4) Oregon (us-west1)
Claude Opus 4.6 da Anthropic
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5, da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4, da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

Países Baixos (europe-west4) Bélgica (europe-west1)
Claude Opus 4.6 da Anthropic
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5
Claude Opus 4 da Anthropic
Claude Sonnet 4, da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Ásia-Pacífico

Singapura (asia-southeast1) Taiwan (asia-east1)*
Claude Opus 4.6 da Anthropic
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5, da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4, da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

Global (global)
Claude Opus 4.6 da Anthropic
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5, da Anthropic
Claude Opus 4 da Anthropic
Claude Sonnet 4, da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Haiku do Claude 3 da Anthropic
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

* O suporte para essa região será descontinuado em 27 de fevereiro de 2025.

Google Cloud locais de endpoints de modelos abertos

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos abertos da Vertex AI para MaaS.

Os endpoints de modelos abertos para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina do Sul (us-east1) Norte da Virgínia (us-east4) Oregon (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
GLM 5
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

Países Baixos (europe-west4) Bélgica (europe-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
GLM 5
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Ásia-Pacífico

Singapura (asia-southeast1) Taiwan (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
GLM 5
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Global

Global (global)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
GLM 5
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.3 70B (pré-lançamento)
Llama 4 Maverick 17B-128E (pré-lançamento)
Llama 4 Scout 17B-16E (pré-lançamento)
MiniMax M2
Multilíngue E5 Large
E5 Small multilíngue
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

A seguir