Os modelos do Google e dos parceiros e os recursos de IA generativa na Vertex AI são expostos como endpoints regionais específicos e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que as regiões únicas.
Endpoint global
Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de recurso esgotado (429). Não use o endpoint global se você tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.
Modelos compatíveis
O uso do endpoint global é compatível com os seguintes modelos do Google nas regiões especificadas. Para saber quais regiões oferecem suporte ao endpoint global, consulte a guia Global na tabela de locais de endpoints de modelos do Google.
- Gemini 3 Flash (pré-lançamento)
- Gemini 3 Pro (pré-lançamento)
- Imagem do Gemini 3 Pro (pré-lançamento)
- Gemini 2.5 Pro
- Gemini 2.5 Flash (pré-lançamento)
- Gemini 2.5 Flash-Lite (pré-lançamento)
- Criação de Imagens do Gemini 2.5 Flash
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.0 Flash
- Gemini 2.0 Flash Lite
Para informações sobre a disponibilidade global de endpoints para modelos de parceiros, consulte a guia Global na tabela de locais de endpoints de modelos de parceiros doGoogle Cloud .
Usar o endpoint global
Para usar o endpoint global, exclua o local do nome do endpoint e configure o local do recurso como global. Por exemplo, o seguinte é um URL de endpoint global:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Para o SDK da IA generativa do Google, crie um cliente que use o local global:
# google-genai >= 0.8.0 is required
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Para o SDK da Vertex AI para Python,
inicialize o SDK usando o local global:
# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitações
Os seguintes recursos não estão disponíveis ao usar o endpoint global:
- Ajuste
- Previsão em lote para modelos da Anthropic e do OpenMaaS
- Corpus de geração aumentada por recuperação (RAG) (as solicitações de RAG são aceitas)
O uso do endpoint global com capacidade de processamento provisionada está disponível apenas para os seguintes modelos:
Clique para ver os modelos compatíveis com o endpoint global ao usar a capacidade de processamento provisionada
| Modelo | Versão mais recente do modelo com suporte |
|---|---|
| Gemini 3 Flash pré-lançamento | gemini-3-flash-preview |
| Gemini 3 Pro pré-lançamento | gemini-3-pro-preview |
| Imagem do Gemini 3 Pro pré-lançamento | gemini-3-pro-image-preview |
| Gemini 2.5 Pro | gemini-2.5-pro |
| Gemini 2.5 Flash pré-lançamento | gemini-2.5-flash-preview-09-2025 |
| Gemini 2.5 Flash-Lite pré-lançamento | gemini-2.5-flash-lite-preview-09-2025 |
| Criação de Imagens do Gemini 2.5 Flash | gemini-2.5-flash-image |
| Gemini 2.5 Flash | gemini-2.5-flash |
| Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
| Gemini 2.0 Flash | gemini-2.0-flash-001 |
| Gemini 2.0 Flash Lite | gemini-2.0-flash-lite-001 |
Locais de endpoints de modelos do Google
Os modelos do Google na Vertex AI estão disponíveis para os seguintes endpoints:
Global
| Global(global) | |
|---|---|
| Modelos do Gemini | |
Gemini 3 Flash
pré-lançamento
(gemini-3-flash-preview)
|
|
Gemini 3 Pro
pré-lançamento
(gemini-3-pro-preview)
|
|
Gemini 3 Pro Image
pré-lançamento
(gemini-3-pro-image-preview)
|
|
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|
Gemini 2.5 Flash
pré-lançamento
(gemini-2.5-flash-preview-09-2025)
|
|
Gemini 2.5 Flash-Lite
pré-lançamento
(gemini-2.5-flash-lite-preview-09-2025)
|
|
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
|
|
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
|
Gemini 2.5 Flash com áudio nativo da API Gemini Live
pré-lançamento
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|
Gemini 2.0 Flash com a API Gemini Live
pré-lançamento
(gemini-2.0-flash-live-preview-04-09)
|
|
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|
Gemini 2.0 Flash Lite
(gemini-2.0-flash-lite)
|
|
| Modelos de embeddings | |
Embeddings do Gemini
(gemini-embeddings-001)
|
|
| Embeddings para texto | |
| Embeddings para multimodal | |
| Modelos da Imagen na Vertex AI | |
Imagen 3
(imagen-3.0-generate-002)
|
|
Imagen 3
(imagen-3.0-generate-001)
|
|
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|
Personalização controlada do Imagen 3
(imagen-3.0-capability-001)
|
|
Imagem 4
(imagen-4.0-generate-001)
|
|
Imagem 4
(imagen-4.0-fast-generate-001)
|
|
Geração do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
|
|
| Modelos do Veo na Vertex AI | |
Veo 2 Generate
(veo-2.0-generate-001)
|
|
Geração do Veo 2
prévia
(veo-2.0-generate-exp)
|
|
Geração do Veo 2
prévia
(veo-2.0-generate-preview)
|
|
Geração do Veo 3
prévia
(veo-3.0-generate-preview)
|
|
Geração do Veo 3
prévia
(veo-3.0-fast-generate-preview)
|
|
Geração do Veo 3
(veo-3.0-generate-001)
|
|
Geração rápida do Veo 3
(veo-3.0-fast-generate-001)
|
|
Veo 3.1 Gerar
prévia
(veo-3.1-generate-preview)
|
|
Geração rápida do Veo 3.1
prévia
(veo-3.1-fast-generate-preview)
|
|
Geração do Veo 3.1
(veo-3.1-generate-001)
|
|
Geração rápida do Veo 3.1
(veo-3.1-fast-generate-001)
|
|
| Modelos de Speech-to-Text e Text-to-Speech | |
Chirp 3: transcrição
(chirp_3)
|
|
| Chirp 3: vozes em alta definição | |
| Chirp 3: voz personalizada instantânea | |
Chirp 2: transcrição
(chirp_2)
|
|
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|
Pré-lançamento do Gemini 2.5 Flash Lite TTS
pré-lançamento
(gemini-2.5-flash-lite-preview-tts)
|
|
Estados Unidos
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | Carolina do Sul(us-east1) | N. Virgínia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Modelos do Gemini | |||||||
Gemini 3 Flash
pré-lançamento
(gemini-3-flash-preview)
|
|||||||
Gemini 3 Pro
pré-lançamento
(gemini-3-pro-preview)
|
|||||||
Gemini 3 Pro Image
pré-lançamento
(gemini-3-pro-image-preview)
|
|||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||||||
Gemini 2.5 Flash
pré-lançamento
(gemini-2.5-flash-preview-09-2025)
|
|||||||
Gemini 2.5 Flash-Lite
pré-lançamento
(gemini-2.5-flash-lite-preview-09-2025)
|
|||||||
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
|
|||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||||||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
|||||||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
pré-lançamento
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||||||
Gemini 2.0 Flash com a API Gemini Live
pré-lançamento
(gemini-2.0-flash-live-preview-04-09)
|
|||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||||||
Gemini 2.0 Flash Lite
(gemini-2.0-flash-lite)
|
|||||||
| Modelos de embeddings | |||||||
Embeddings do Gemini
(gemini-embeddings-001)
|
|||||||
| Embeddings para texto | |||||||
| Embeddings para multimodal | |||||||
| Modelos da Imagen na Vertex AI | |||||||
Imagen 3
(imagen-3.0-generate-002)
|
|||||||
Imagen 3
(imagen-3.0-generate-001)
|
|||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||||||
Personalização controlada do Imagen 3
(imagen-3.0-capability-001)
|
|||||||
Imagem 4
(imagen-4.0-generate-001)
|
|||||||
Imagem 4
(imagen-4.0-fast-generate-001)
|
|||||||
Geração do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
|
|||||||
| Modelos do Veo na Vertex AI | |||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||||||
Geração do Veo 2
prévia
(veo-2.0-generate-exp)
|
|||||||
Geração do Veo 2
prévia
(veo-2.0-generate-preview)
|
|||||||
Geração do Veo 3
prévia
(veo-3.0-generate-preview)
|
|||||||
Geração do Veo 3
prévia
(veo-3.0-fast-generate-preview)
|
|||||||
Geração do Veo 3
(veo-3.0-generate-001)
|
|||||||
Geração rápida do Veo 3
(veo-3.0-fast-generate-001)
|
|||||||
Veo 3.1 Gerar
prévia
(veo-3.1-generate-preview)
|
|||||||
Geração rápida do Veo 3.1
prévia
(veo-3.1-fast-generate-preview)
|
|||||||
Geração do Veo 3.1
(veo-3.1-generate-001)
|
|||||||
Geração rápida do Veo 3.1
(veo-3.1-fast-generate-001)
|
|||||||
| Modelos de Speech-to-Text e Text-to-Speech | |||||||
Chirp 3: transcrição
(chirp_3)
|
|||||||
| Chirp 3: vozes em alta definição | |||||||
| Chirp 3: voz personalizada instantânea | |||||||
Chirp 2: transcrição
(chirp_2)
|
|||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||||||
Pré-lançamento do Gemini 2.5 Flash Lite TTS
pré-lançamento
(gemini-2.5-flash-lite-preview-tts)
|
|||||||
Américas
| Montreal(northamerica-northeast1) | São Paulo(southamerica-east1) | |
|---|---|---|
| Modelos do Gemini | ||
Gemini 3 Flash
pré-lançamento
(gemini-3-flash-preview)
|
||
Gemini 3 Pro
pré-lançamento
(gemini-3-pro-preview)
|
||
Gemini 3 Pro Image
pré-lançamento
(gemini-3-pro-image-preview)
|
||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
||
Gemini 2.5 Flash
pré-lançamento
(gemini-2.5-flash-preview-09-2025)
|
||
Gemini 2.5 Flash-Lite
pré-lançamento
(gemini-2.5-flash-lite-preview-09-2025)
|
||
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
|
||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
pré-lançamento
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
||
Gemini 2.0 Flash com a API Gemini Live
pré-lançamento
(gemini-2.0-flash-live-preview-04-09)
|
||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
||
Gemini 2.0 Flash Lite
(gemini-2.0-flash-lite)
|
||
| Modelos de embeddings | ||
Embeddings do Gemini
(gemini-embeddings-001)
|
||
| Embeddings para texto | ||
| Embeddings para multimodal | ||
| Modelos da Imagen na Vertex AI | ||
Imagen 3
(imagen-3.0-generate-002)
|
||
Imagen 3
(imagen-3.0-generate-001)
|
||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
||
Personalização controlada do Imagen 3
(imagen-3.0-capability-001)
|
||
Imagem 4
(imagen-4.0-generate-001)
|
||
Imagem 4
(imagen-4.0-fast-generate-001)
|
||
Geração do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
|
||
| Modelos do Veo na Vertex AI | ||
Veo 2 Generate
(veo-2.0-generate-001)
|
||
Geração do Veo 2
prévia
(veo-2.0-generate-exp)
|
||
Geração do Veo 2
prévia
(veo-2.0-generate-preview)
|
||
Geração do Veo 3
prévia
(veo-3.0-generate-preview)
|
||
Geração do Veo 3
prévia
(veo-3.0-fast-generate-preview)
|
||
Geração do Veo 3
(veo-3.0-generate-001)
|
||
Geração rápida do Veo 3
(veo-3.0-fast-generate-001)
|
||
Veo 3.1 Gerar
prévia
(veo-3.1-generate-preview)
|
||
Geração rápida do Veo 3.1
prévia
(veo-3.1-fast-generate-preview)
|
||
Geração do Veo 3.1
(veo-3.1-generate-001)
|
||
Geração rápida do Veo 3.1
(veo-3.1-fast-generate-001)
|
||
| Modelos de Speech-to-Text e Text-to-Speech | ||
Chirp 3: transcrição
(chirp_3)
|
||
| Chirp 3: vozes em alta definição | ||
| Chirp 3: voz personalizada instantânea | ||
Chirp 2: transcrição
(chirp_2)
|
||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
||
Pré-lançamento do Gemini 2.5 Flash Lite TTS
pré-lançamento
(gemini-2.5-flash-lite-preview-tts)
|
||
Europa
| Londres(europe-west2) | Bélgica(europe-west1) | Países Baixos(europe-west4) | Zurique(europe-west6) | Frankfurt(europe-west3) | Finlândia(europe-north1) | Varsóvia(europe-central2) | Milão(europe-west8) | Madri(europe-southwest1) | Paris(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Modelos do Gemini | ||||||||||
Gemini 3 Flash
pré-lançamento
(gemini-3-flash-preview)
|
||||||||||
Gemini 3 Pro
pré-lançamento
(gemini-3-pro-preview)
|
||||||||||
Gemini 3 Pro Image
pré-lançamento
(gemini-3-pro-image-preview)
|
||||||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
||||||||||
Gemini 2.5 Flash
pré-lançamento
(gemini-2.5-flash-preview-09-2025)
|
||||||||||
Gemini 2.5 Flash-Lite
pré-lançamento
(gemini-2.5-flash-lite-preview-09-2025)
|
||||||||||
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
|
||||||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
||||||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
||||||||||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
||||||||||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
pré-lançamento
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
||||||||||
Gemini 2.0 Flash com a API Gemini Live
pré-lançamento
(gemini-2.0-flash-live-preview-04-09)
|
||||||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
||||||||||
Gemini 2.0 Flash Lite
(gemini-2.0-flash-lite)
|
||||||||||
| Modelos de embeddings | ||||||||||
Embeddings do Gemini
(gemini-embeddings-001)
|
||||||||||
| Embeddings para texto | ||||||||||
| Embeddings para multimodal | ||||||||||
| Modelos da Imagen na Vertex AI | ||||||||||
Imagen 3
(imagen-3.0-generate-002)
|
||||||||||
Imagen 3
(imagen-3.0-generate-001)
|
||||||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
||||||||||
Personalização controlada do Imagen 3
(imagen-3.0-capability-001)
|
||||||||||
Imagem 4
(imagen-4.0-generate-001)
|
||||||||||
Imagem 4
(imagen-4.0-fast-generate-001)
|
||||||||||
Geração do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
|
||||||||||
| Modelos do Veo na Vertex AI | ||||||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
||||||||||
Geração do Veo 2
prévia
(veo-2.0-generate-exp)
|
||||||||||
Geração do Veo 2
prévia
(veo-2.0-generate-preview)
|
||||||||||
Geração do Veo 3
prévia
(veo-3.0-generate-preview)
|
||||||||||
Geração do Veo 3
prévia
(veo-3.0-fast-generate-preview)
|
||||||||||
Geração do Veo 3
(veo-3.0-generate-001)
|
||||||||||
Geração rápida do Veo 3
(veo-3.0-fast-generate-001)
|
||||||||||
Veo 3.1 Gerar
prévia
(veo-3.1-generate-preview)
|
||||||||||
Geração rápida do Veo 3.1
prévia
(veo-3.1-fast-generate-preview)
|
||||||||||
Geração do Veo 3.1
(veo-3.1-generate-001)
|
||||||||||
Geração rápida do Veo 3.1
(veo-3.1-fast-generate-001)
|
||||||||||
| Modelos de Speech-to-Text e Text-to-Speech | ||||||||||
Chirp 3: transcrição
(chirp_3)
|
||||||||||
| Chirp 3: vozes em alta definição | ||||||||||
| Chirp 3: voz personalizada instantânea | ||||||||||
Chirp 2: transcrição
(chirp_2)
|
||||||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
||||||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
||||||||||
Pré-lançamento do Gemini 2.5 Flash Lite TTS
pré-lançamento
(gemini-2.5-flash-lite-preview-tts)
|
||||||||||
Ásia-Pacífico
| Mumbai(asia-south1) | Singapura(asia-southeast1) | Hong Kong(asia-east2) | Taiwan(asia-east1) | Tóquio(asia-northeast1) | Sydney(australia-southeast1) | Seul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Modelos do Gemini | |||||||
Gemini 3 Flash
pré-lançamento
(gemini-3-flash-preview)
|
|||||||
Gemini 3 Pro
pré-lançamento
(gemini-3-pro-preview)
|
|||||||
Gemini 3 Pro Image
pré-lançamento
(gemini-3-pro-image-preview)
|
|||||||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||||||
Gemini 2.5 Flash
pré-lançamento
(gemini-2.5-flash-preview-09-2025)
|
|||||||
Gemini 2.5 Flash-Lite
pré-lançamento
(gemini-2.5-flash-lite-preview-09-2025)
|
|||||||
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
|
|||||||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||||||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||||||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
|||||||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
pré-lançamento
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||||||
Gemini 2.0 Flash com a API Gemini Live
pré-lançamento
(gemini-2.0-flash-live-preview-04-09)
|
|||||||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||||||
Gemini 2.0 Flash Lite
(gemini-2.0-flash-lite)
|
|||||||
| Modelos de embeddings | |||||||
Embeddings do Gemini
(gemini-embeddings-001)
|
|||||||
| Embeddings para texto | |||||||
| Embeddings para multimodal | |||||||
| Modelos da Imagen na Vertex AI | |||||||
Imagen 3
(imagen-3.0-generate-002)
|
|||||||
Imagen 3
(imagen-3.0-generate-001)
|
|||||||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||||||
Personalização controlada do Imagen 3
(imagen-3.0-capability-001)
|
|||||||
Imagem 4
(imagen-4.0-generate-001)
|
|||||||
Imagem 4
(imagen-4.0-fast-generate-001)
|
|||||||
Geração do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
|
|||||||
| Modelos do Veo na Vertex AI | |||||||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||||||
Geração do Veo 2
prévia
(veo-2.0-generate-exp)
|
|||||||
Geração do Veo 2
prévia
(veo-2.0-generate-preview)
|
|||||||
Geração do Veo 3
prévia
(veo-3.0-generate-preview)
|
|||||||
Geração do Veo 3
prévia
(veo-3.0-fast-generate-preview)
|
|||||||
Geração do Veo 3
(veo-3.0-generate-001)
|
|||||||
Geração rápida do Veo 3
(veo-3.0-fast-generate-001)
|
|||||||
Veo 3.1 Gerar
prévia
(veo-3.1-generate-preview)
|
|||||||
Geração rápida do Veo 3.1
prévia
(veo-3.1-fast-generate-preview)
|
|||||||
Geração do Veo 3.1
(veo-3.1-generate-001)
|
|||||||
Geração rápida do Veo 3.1
(veo-3.1-fast-generate-001)
|
|||||||
| Modelos de Speech-to-Text e Text-to-Speech | |||||||
Chirp 3: transcrição
(chirp_3)
|
|||||||
| Chirp 3: vozes em alta definição | |||||||
| Chirp 3: voz personalizada instantânea | |||||||
Chirp 2: transcrição
(chirp_2)
|
|||||||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||||||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||||||
Pré-lançamento do Gemini 2.5 Flash Lite TTS
pré-lançamento
(gemini-2.5-flash-lite-preview-tts)
|
|||||||
Oriente Médio
| Tel Aviv(me-west1) | Doha(me-central1) | Damã(me-central2) | |
|---|---|---|---|
| Modelos do Gemini | |||
Gemini 3 Flash
pré-lançamento
(gemini-3-flash-preview)
|
|||
Gemini 3 Pro
pré-lançamento
(gemini-3-pro-preview)
|
|||
Gemini 3 Pro Image
pré-lançamento
(gemini-3-pro-image-preview)
|
|||
Gemini 2.5 Pro
(gemini-2.5-pro)
|
|||
Gemini 2.5 Flash
pré-lançamento
(gemini-2.5-flash-preview-09-2025)
|
|||
Gemini 2.5 Flash-Lite
pré-lançamento
(gemini-2.5-flash-lite-preview-09-2025)
|
|||
Criação de Imagens do Gemini 2.5 Flash
(gemini-2.5-flash-image)
|
|||
Gemini 2.5 Flash
(gemini-2.5-flash)
|
|||
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
|
|||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
(gemini-live-2.5-flash-native-audio)
|
|||
Gemini 2.5 Flash com áudio nativo da API Gemini Live
pré-lançamento
(gemini-live-2.5-flash-preview-native-audio-09-2025)
|
|||
Gemini 2.0 Flash com a API Gemini Live
pré-lançamento
(gemini-2.0-flash-live-preview-04-09)
|
|||
Gemini 2.0 Flash
(gemini-2.0-flash)
|
|||
Gemini 2.0 Flash Lite
(gemini-2.0-flash-lite)
|
|||
| Modelos de embeddings | |||
Embeddings do Gemini
(gemini-embeddings-001)
|
|||
| Embeddings para texto | |||
| Embeddings para multimodal | |||
| Modelos da Imagen na Vertex AI | |||
Imagen 3
(imagen-3.0-generate-002)
|
|||
Imagen 3
(imagen-3.0-generate-001)
|
|||
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
|
|||
Personalização controlada do Imagen 3
(imagen-3.0-capability-001)
|
|||
Imagem 4
(imagen-4.0-generate-001)
|
|||
Imagem 4
(imagen-4.0-fast-generate-001)
|
|||
Geração do Imagen 4 Ultra
(imagen-4.0-ultra-generate-001)
|
|||
| Modelos do Veo na Vertex AI | |||
Veo 2 Generate
(veo-2.0-generate-001)
|
|||
Geração do Veo 2
prévia
(veo-2.0-generate-exp)
|
|||
Geração do Veo 2
prévia
(veo-2.0-generate-preview)
|
|||
Geração do Veo 3
prévia
(veo-3.0-generate-preview)
|
|||
Geração do Veo 3
prévia
(veo-3.0-fast-generate-preview)
|
|||
Geração do Veo 3
(veo-3.0-generate-001)
|
|||
Geração rápida do Veo 3
(veo-3.0-fast-generate-001)
|
|||
Veo 3.1 Gerar
prévia
(veo-3.1-generate-preview)
|
|||
Geração rápida do Veo 3.1
prévia
(veo-3.1-fast-generate-preview)
|
|||
Geração do Veo 3.1
(veo-3.1-generate-001)
|
|||
Geração rápida do Veo 3.1
(veo-3.1-fast-generate-001)
|
|||
| Modelos de Speech-to-Text e Text-to-Speech | |||
Chirp 3: transcrição
(chirp_3)
|
|||
| Chirp 3: vozes em alta definição | |||
| Chirp 3: voz personalizada instantânea | |||
Chirp 2: transcrição
(chirp_2)
|
|||
Gemini 2.5 Pro TTS
(gemini-2.5-pro-tts)
|
|||
Gemini 2.5 Flash TTS
(gemini-2.5-flash-tts)
|
|||
Pré-lançamento do Gemini 2.5 Flash Lite TTS
pré-lançamento
(gemini-2.5-flash-lite-preview-tts)
|
|||
Google Cloud locais de endpoints de modelos de parceiros
O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros da Vertex AI para MaaS.
Os endpoints de modelos de parceiros para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:
Global
| Global(global) | |
|---|---|
| Modelos da Anthropic | |
| Claude Opus 4.6 | |
| Claude Opus 4.5 | |
| Claude Sonnet 4.5 | |
| Claude Opus 4.1 | |
| Claude Haiku 4.5 | |
| Claude Opus 4 | |
| Claude Sonnet 4 | |
| Claude 3.7 Sonnet da Anthropic | |
| Claude 3.5 Haiku da Anthropic | |
| Haiku do Claude 3 da Anthropic | |
| Modelos da Mistral | |
| Mistral Medium 3 | |
| OCR do Mistral (25/05) | |
| Mistral Small 3.1 (25/03) | |
| Mistral Large (24.07) | |
| Codestral 2 | |
| Codestral (24.05) | |
Estados Unidos
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | Carolina do Sul(us-east1) | N. Virgínia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Modelos da Anthropic | |||||||
| Claude Opus 4.6 | |||||||
| Claude Opus 4.5 | |||||||
| Claude Sonnet 4.5 | |||||||
| Claude Opus 4.1 | |||||||
| Claude Haiku 4.5 | |||||||
| Claude Opus 4 | |||||||
| Claude Sonnet 4 | |||||||
| Claude 3.7 Sonnet da Anthropic | |||||||
| Claude 3.5 Haiku da Anthropic | |||||||
| Haiku do Claude 3 da Anthropic | |||||||
| Modelos da Mistral | |||||||
| Mistral Medium 3 | |||||||
| OCR do Mistral (25/05) | |||||||
| Mistral Small 3.1 (25/03) | |||||||
| Mistral Large (24.07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) | |||||||
Américas
| Montreal(northamerica-northeast1) | São Paulo(southamerica-east1) | |
|---|---|---|
| Modelos da Anthropic | ||
| Claude Opus 4.6 | ||
| Claude Opus 4.5 | ||
| Claude Sonnet 4.5 | ||
| Claude Opus 4.1 | ||
| Claude Haiku 4.5 | ||
| Claude Opus 4 | ||
| Claude Sonnet 4 | ||
| Claude 3.7 Sonnet da Anthropic | ||
| Claude 3.5 Haiku da Anthropic | ||
| Haiku do Claude 3 da Anthropic | ||
| Modelos da Mistral | ||
| Mistral Medium 3 | ||
| OCR do Mistral (25/05) | ||
| Mistral Small 3.1 (25/03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) | ||
Europa
| Londres(europe-west2) | Bélgica(europe-west1) | Países Baixos(europe-west4) | Zurique(europe-west6) | Frankfurt(europe-west3) | Finlândia(europe-north1) | Varsóvia(europe-central2) | Milão(europe-west8) | Madri(europe-southwest1) | Paris(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Modelos da Anthropic | ||||||||||
| Claude Opus 4.6 | ||||||||||
| Claude Opus 4.5 | ||||||||||
| Claude Sonnet 4.5 | ||||||||||
| Claude Opus 4.1 | ||||||||||
| Claude Haiku 4.5 | ||||||||||
| Claude Opus 4 | ||||||||||
| Claude Sonnet 4 | ||||||||||
| Claude 3.7 Sonnet da Anthropic | ||||||||||
| Claude 3.5 Haiku da Anthropic | ||||||||||
| Haiku do Claude 3 da Anthropic | ||||||||||
| Modelos da Mistral | ||||||||||
| Mistral Medium 3 | ||||||||||
| OCR do Mistral (25/05) | ||||||||||
| Mistral Small 3.1 (25/03) | ||||||||||
| Mistral Large (24.07) | ||||||||||
| Codestral 2 | ||||||||||
| Codestral (24.05) | ||||||||||
Ásia-Pacífico
| Mumbai(asia-south1) | Singapura(asia-southeast1) | Hong Kong(asia-east2) | Taiwan(asia-east1) | Tóquio(asia-northeast1) | Sydney(australia-southeast1) | Seul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Modelos da Anthropic | |||||||
| Claude Opus 4.6 | |||||||
| Claude Opus 4.5 | |||||||
| Claude Sonnet 4.5 | |||||||
| Claude Opus 4.1 | |||||||
| Claude Haiku 4.5 | |||||||
| Claude Opus 4 | |||||||
| Claude Sonnet 4 | |||||||
| Claude 3.7 Sonnet, da Anthropic | |||||||
| Claude 3.5 Haiku da Anthropic | |||||||
| Haiku do Claude 3 da Anthropic | |||||||
| Modelos da Mistral | |||||||
| Mistral Medium 3 | |||||||
| OCR do Mistral (25/05) | |||||||
| Mistral Small 3.1 (25/03) | |||||||
| Mistral Large (24.07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) | |||||||
Oriente Médio
| Tel Aviv(me-west1) | Doha(me-central1) | Damã(me-central2) | |
|---|---|---|---|
| Modelos da Anthropic | |||
| Claude Opus 4.6 | |||
| Claude Opus 4.5 | |||
| Claude Sonnet 4.5 | |||
| Claude Opus 4.1 | |||
| Claude Haiku 4.5 | |||
| Claude Opus 4 | |||
| Claude Sonnet 4 | |||
| Claude 3.7 Sonnet da Anthropic | |||
| Claude 3.5 Haiku da Anthropic | |||
| Haiku do Claude 3 da Anthropic | |||
| Modelos da Mistral | |||
| Mistral Medium 3 | |||
| OCR do Mistral (25/05) | |||
| Mistral Small 3.1 (25/03) | |||
| Mistral Large (24.07) | |||
| Codestral 2 | |||
| Codestral (24.05) | |||
Google Cloud locais de endpoints de modelos abertos
O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos abertos da Vertex AI para MaaS.
Os endpoints de modelos abertos para a IA generativa na Vertex AI estão disponíveis nas seguintes regiões:
Global
| Global(global) | |
|---|---|
| Modelos DeepSeek | |
DeepSeek-OCR
(deepseek-ocr-maas)
|
|
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|
| Modelos do ZAI.org | |
GLM 4.7
(glm-4.7-maas)
|
|
GLM 5
(glm-5-maas)
|
|
| Modelos da OpenAI | |
gpt-oss 120B
(gpt-oss-120b-maas)
|
|
gpt-oss 20B
(gpt-oss-20b-maas)
|
|
| Modelos da Moonshot AI | |
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|
| Modelos Llama | |
| Llama 3.3 70B | |
| Llama 4 Maverick 17B-128E | |
| Llama 4 Scout 17B-16E | |
| Modelos MiniMax | |
MiniMax M2
(minimax-m2-maas)
|
|
| Modelos Qwen | |
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|
| Modelos e5 | |
Multilingual E5 Small
(multilingual-e5-small-maas)
|
|
E5 Large multilíngue
(multilingual-e5-large-instruct-maas)
|
|
Estados Unidos
| Oregon(us-west1) | Las Vegas(us-west4) | Iowa(us-central1) | Carolina do Sul(us-east1) | N. Virgínia(us-east4) | Columbus(us-east5) | Dallas(us-south1) | |
|---|---|---|---|---|---|---|---|
| Modelos DeepSeek | |||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||||||
| Modelos do ZAI.org | |||||||
GLM 4.7
(glm-4.7-maas)
|
|||||||
GLM 5
(glm-5-maas)
|
|||||||
| Modelos da OpenAI | |||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||||||
| Modelos da Moonshot AI | |||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||||||
| Modelos Llama | |||||||
| Llama 3.3 70B | |||||||
| Llama 4 Maverick 17B-128E | |||||||
| Llama 4 Scout 17B-16E | |||||||
| Modelos MiniMax | |||||||
MiniMax M2
(minimax-m2-maas)
|
|||||||
| Modelos Qwen | |||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||||||
| Modelos e5 | |||||||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
|||||||
E5 Large multilíngue
(multilingual-e5-large-instruct-maas)
|
|||||||
Américas
| Montreal(northamerica-northeast1) | São Paulo(southamerica-east1) | |
|---|---|---|
| Modelos DeepSeek | ||
DeepSeek-OCR
(deepseek-ocr-maas)
|
||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
||
| Modelos do ZAI.org | ||
GLM 4.7
(glm-4.7-maas)
|
||
GLM 5
(glm-5-maas)
|
||
| Modelos da OpenAI | ||
gpt-oss 120B
(gpt-oss-120b-maas)
|
||
gpt-oss 20B
(gpt-oss-20b-maas)
|
||
| Modelos da Moonshot AI | ||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
||
| Modelos Llama | ||
| Llama 3.3 70B | ||
| Llama 4 Maverick 17B-128E | ||
| Llama 4 Scout 17B-16E | ||
| Modelos MiniMax | ||
MiniMax M2
(minimax-m2-maas)
|
||
| Modelos Qwen | ||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
||
| Modelos e5 | ||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
||
E5 Large multilíngue
(multilingual-e5-large-instruct-maas)
|
||
Europa
| Londres(europe-west2) | Bélgica(europe-west1) | Países Baixos(europe-west4) | Zurique(europe-west6) | Frankfurt(europe-west3) | Finlândia(europe-north1) | Varsóvia(europe-central2) | Milão(europe-west8) | Madri(europe-southwest1) | Paris(europe-west9) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Modelos DeepSeek | ||||||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
||||||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
||||||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
||||||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
||||||||||
| Modelos do ZAI.org | ||||||||||
GLM 4.7
(glm-4.7-maas)
|
||||||||||
GLM 5
(glm-5-maas)
|
||||||||||
| Modelos da OpenAI | ||||||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
||||||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
||||||||||
| Modelos da Moonshot AI | ||||||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
||||||||||
| Modelos Llama | ||||||||||
| Llama 3.3 70B | ||||||||||
| Llama 4 Maverick 17B-128E | ||||||||||
| Llama 4 Scout 17B-16E | ||||||||||
| Modelos MiniMax | ||||||||||
MiniMax M2
(minimax-m2-maas)
|
||||||||||
| Modelos Qwen | ||||||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
||||||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
||||||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
||||||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
||||||||||
| Modelos e5 | ||||||||||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
||||||||||
E5 Large multilíngue
(multilingual-e5-large-instruct-maas)
|
||||||||||
Ásia-Pacífico
| Mumbai(asia-south1) | Singapura(asia-southeast1) | Hong Kong(asia-east2) | Taiwan(asia-east1) | Tóquio(asia-northeast1) | Sydney(australia-southeast1) | Seul(asia-northeast3) | |
|---|---|---|---|---|---|---|---|
| Modelos DeepSeek | |||||||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||||||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||||||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||||||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||||||
| Modelos do ZAI.org | |||||||
GLM 4.7
(glm-4.7-maas)
|
|||||||
GLM 5
(glm-5-maas)
|
|||||||
| Modelos da OpenAI | |||||||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||||||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||||||
| Modelos da Moonshot AI | |||||||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||||||
| Modelos Llama | |||||||
| Llama 3.3 70B | |||||||
| Llama 4 Maverick 17B-128E | |||||||
| Llama 4 Scout 17B-16E | |||||||
| Modelos MiniMax | |||||||
MiniMax M2
(minimax-m2-maas)
|
|||||||
| Modelos Qwen | |||||||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||||||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||||||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||||||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||||||
| Modelos e5 | |||||||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
|||||||
E5 Large multilíngue
(multilingual-e5-large-instruct-maas)
|
|||||||
Oriente Médio
| Tel Aviv(me-west1) | Doha(me-central1) | Damã(me-central2) | |
|---|---|---|---|
| Modelos DeepSeek | |||
DeepSeek-OCR
(deepseek-ocr-maas)
|
|||
DeepSeek-V3.2
(deepseek-v3.2-maas)
|
|||
DeepSeek-V3.1
(deepseek-v3.1-maas)
|
|||
DeepSeek R1 (0528)
(deepseek-r1-0528-maas)
|
|||
| Modelos do ZAI.org | |||
GLM 4.7
(glm-4.7-maas)
|
|||
GLM 5
(glm-5-maas)
|
|||
| Modelos da OpenAI | |||
gpt-oss 120B
(gpt-oss-120b-maas)
|
|||
gpt-oss 20B
(gpt-oss-20b-maas)
|
|||
| Modelos da Moonshot AI | |||
Kimi K2 Thinking
(kimi-k2-thinking-maas)
|
|||
| Modelos Llama | |||
| Llama 3.3 70B | |||
| Llama 4 Maverick 17B-128E | |||
| Llama 4 Scout 17B-16E | |||
| Modelos MiniMax | |||
MiniMax M2
(minimax-m2-maas)
|
|||
| Modelos Qwen | |||
Qwen3-Next-80B Thinking
(qwen3-next-80b-a3b-thinking-maas)
|
|||
Qwen3-Next-80B Instruct
(qwen3-next-80b-a3b-instruct-maas)
|
|||
Qwen3 Coder
(qwen3-coder-480b-a35b-instruct-maas)
|
|||
Qwen3 235B
(qwen3-235b-a22b-instruct-2507-maas)
|
|||
| Modelos e5 | |||
Multilingual E5 Small
(multilingual-e5-small-maas)
|
|||
E5 Large multilíngue
(multilingual-e5-large-instruct-maas)
|
|||
A seguir
- Saiba mais sobre a residência de dados da IA generativa na Vertex AI.
- Saiba mais sobre as regiões doGoogle Cloud .
- Saiba mais sobre os controles de segurança por recurso.
- Saiba mais sobre os modelos que oferecem suporte à IA generativa na Vertex AI. Consulte Referência do modelo de fundação da IA generativa.
- Saiba mais sobre os locais da Vertex AI.