Os dados armazenados em repouso no local selecionado pelo cliente permanecem em repouso nesse local, independente do endpoint da IA generativa na Vertex AI chamado pela solicitação desse cliente.
Processamento de ML
O processamento de machine learning (ML) para serviços de IA generativa na Vertex AI ocorre na região ou multirregião específica em que a solicitação é feita.
Para qualquer endpoint regional não listado explicitamente nas tabelas a seguir, como os do Oriente Médio, não há garantia de que o processamento de ML ocorra em um local específico. Esses endpoints são compatíveis com modelos mais antigos que não oferecem garantias de processamento de ML.
Suporte a modelosGoogle Cloud
Para saber quais recursos oferecem suporte à residência de dados, consulte Recursos compatíveis.
Multirregional
| Modelo | EUA multirregional | UE multirregional |
|---|---|---|
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
|
||
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
|
||
Imagem do Gemini 2.5 Flash(gemini-2.5-flash-image)
|
||
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
|
||
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
|
||
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
|
||
Ajuste para o Gemini 2.5 Flash(gemini-2.5-flash)
|
||
Ajuste do Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
|
||
Ajuste para o Gemini 2.5 Pro(gemini-2.5-pro)
|
||
Gemini 2.0 Flash(gemini-2.0-flash-001)
|
||
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
|
||
Como ajustar o Gemini 2.0 Flash(gemini-2.0-flash-001)
|
||
Ajuste para o Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
|
||
Embeddings do Gemini(gemini-embedding-001)
|
||
Chirp 2: transcrição(chirp_2)
|
||
Chirp 3: transcrição(chirp_3)
|
||
| Chirp 3: vozes em alta definição | ||
| Chirp 3: voz personalizada instantânea | ||
Imagen 2(imagegeneration@005)
|
||
| Embeddings para multimodal | ||
Embeddings para texto(text-embedding-004)
|
||
Embeddings para texto(text-embedding-005)
|
||
Embeddings para texto(text-multilingual-embedding-002)
|
Américas
| Modelo | Canadá(northamerica-northeast1) |
|---|---|
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
|
|
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
|
|
Imagem do Gemini 2.5 Flash(gemini-2.5-flash-image)
|
|
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
|
|
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
|
|
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
|
|
Ajuste para o Gemini 2.5 Flash(gemini-2.5-flash)
|
|
Ajuste para o Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
|
|
Ajuste para o Gemini 2.5 Pro(gemini-2.5-pro)
|
|
Gemini 2.0 Flash(gemini-2.0-flash-001)
|
|
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
|
|
Como ajustar o Gemini 2.0 Flash(gemini-2.0-flash-001)
|
|
Ajuste para o Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
|
|
Embeddings do Gemini(gemini-embedding-001)
|
|
Chirp 2: transcrição(chirp_2)
|
|
Chirp 3: transcrição(chirp_3)
|
|
| Chirp 3: vozes em alta definição | |
| Chirp 3: voz personalizada instantânea | |
Imagen 2(imagegeneration@005)
|
|
| Embeddings para multimodal | |
Embeddings para texto(text-embedding-004)
|
|
Embeddings para texto(text-embedding-005)
|
|
Embeddings para texto(text-multilingual-embedding-002)
|
Europa
| Modelo | França(europe-west9) | Reino Unido(europe-west2) | Alemanha(europe-west3) | Países Baixos(europe-west4) |
|---|---|---|---|---|
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
|
||||
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
|
||||
Imagem do Gemini 2.5 Flash(gemini-2.5-flash-image)
|
||||
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
|
||||
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
|
||||
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
|
||||
Ajuste para o Gemini 2.5 Flash(gemini-2.5-flash)
|
||||
Ajuste para o Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
|
||||
Ajuste para o Gemini 2.5 Pro(gemini-2.5-pro)
|
||||
Gemini 2.0 Flash(gemini-2.0-flash-001)
|
||||
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
|
||||
Como ajustar o Gemini 2.0 Flash(gemini-2.0-flash-001)
|
||||
Ajuste para o Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
|
||||
Embeddings do Gemini(gemini-embedding-001)
|
||||
Chirp 2: transcrição(chirp_2)
|
||||
Chirp 3: transcrição(chirp_3)
|
||||
| Chirp 3: vozes em alta definição | ||||
| Chirp 3: voz personalizada instantânea | ||||
Imagen 2(imagegeneration@005)
|
||||
| Embeddings para multimodal | ||||
Embeddings para texto(text-embedding-004)
|
||||
Embeddings para texto(text-embedding-005)
|
||||
Embeddings para texto(text-multilingual-embedding-002)
|
Ásia-Pacífico
| Modelo | Japão(asia-northeast1) | Austrália(australia-southeast1) | Índia(asia-south1) | Singapura(asia-southeast1) | Coreia do Sul(asia-northeast3) |
|---|---|---|---|---|---|
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
|
|||||
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
|
|||||
Imagem do Gemini 2.5 Flash(gemini-2.5-flash-image)
|
|||||
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
|
|||||
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
|
|||||
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
|
|||||
Ajuste para o Gemini 2.5 Flash(gemini-2.5-flash)
|
|||||
Ajuste para o Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
|
|||||
Ajuste para o Gemini 2.5 Pro(gemini-2.5-pro)
|
|||||
Gemini 2.0 Flash(gemini-2.0-flash-001)
|
|||||
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
|
|||||
Como ajustar o Gemini 2.0 Flash(gemini-2.0-flash-001)
|
|||||
Ajuste para o Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
|
|||||
Embeddings do Gemini(gemini-embedding-001)
|
|||||
Chirp 2: transcrição(chirp_2)
|
|||||
Chirp 3: transcrição(chirp_3)
|
|||||
| Chirp 3: vozes em alta definição | |||||
| Chirp 3: voz personalizada instantânea | |||||
Imagen 2(imagegeneration@005)
|
|||||
| Embeddings para multimodal | |||||
Embeddings para texto(text-embedding-004)
|
|||||
Embeddings para texto(text-embedding-005)
|
|||||
Embeddings para texto(text-multilingual-embedding-002)
|
Suporte ao modelo deGoogle Cloud parceiro
Multirregional
| Modelo | EUA multirregional | UE multirregional |
|---|---|---|
| Claude Haiku 4.5 da Anthropic | ||
| Claude Opus 4 da Anthropic | ||
| Claude Opus 4.1 da Anthropic | ||
| Claude Opus 4.5 da Anthropic | ||
| Claude Sonnet 4 da Anthropic | ||
| Claude Sonnet 4.5 da Anthropic | ||
| Claude 3.5 Haiku da Anthropic | ||
| Haiku do Claude 3 da Anthropic | ||
| Claude 3.7 Sonnet da Anthropic (descontinuado) | ||
| Codestral (24.05) | ||
| Codestral 2 | ||
| Mistral Large (24.07) | ||
| Mistral Medium 3 | ||
| OCR do Mistral (25/05) | ||
| Mistral Small 3.1 (25/03) |
Europa
| Modelo | Bélgica(europe-west1) | Países Baixos(europe-west4) |
|---|---|---|
| Claude Haiku 4.5 da Anthropic | ||
| Claude Opus 4 da Anthropic | ||
| Claude Opus 4.1 da Anthropic | ||
| Claude Opus 4.5 da Anthropic | ||
| Claude Sonnet 4 da Anthropic | ||
| Claude Sonnet 4.5 da Anthropic | ||
| Claude 3.5 Haiku da Anthropic | ||
| Haiku do Claude 3 da Anthropic | ||
| Claude 3.7 Sonnet da Anthropic (descontinuado) | ||
| Codestral (24.05) | ||
| Codestral 2 | ||
| Mistral Large (24.07) | ||
| Mistral Medium 3 | ||
| OCR do Mistral (25/05) | ||
| Mistral Small 3.1 (25/03) |
Ásia-Pacífico
| Modelo | Singapura(asia-southeast1) | Taiwan(asia-east1) |
|---|---|---|
| Claude Haiku 4.5 da Anthropic | ||
| Claude Opus 4 da Anthropic | ||
| Claude Opus 4.1 da Anthropic | ||
| Claude Opus 4.5 da Anthropic | ||
| Claude Sonnet 4 da Anthropic | ||
| Claude Sonnet 4.5 da Anthropic | ||
| Claude 3.5 Haiku da Anthropic | ||
| Haiku do Claude 3 da Anthropic | ||
| Claude 3.7 Sonnet da Anthropic (descontinuado) | ||
| Codestral (24.05) | ||
| Codestral 2 | ||
| Mistral Large (24.07) | ||
| Mistral Medium 3 | ||
| OCR do Mistral (25/05) | ||
| Mistral Small 3.1 (25/03) |
Google Cloud suporte a modelos abertos
Multirregional
| Modelo | EUA multirregional | UE multirregional |
|---|---|---|
| DeepSeek-OCR | ||
| DeepSeek R1 (0528) | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi K2 Thinking | ||
| Llama 3.1 70B (pré-lançamento) | ||
| Llama 3.1 8B (pré-lançamento) | ||
| Llama 3.2 90B (pré-lançamento) | ||
| Llama 3.3 70B (pré-lançamento) | ||
| Llama 3.1 405B | ||
| Llama 4 Maverick 17B-128E (pré-lançamento) | ||
| Llama 4 Scout 17B-16E (pré-lançamento) | ||
| MiniMax M2 | ||
| Multilíngue E5 Large | ||
| E5 Small multilíngue | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
Europa
| Modelo | Bélgica(europe-west1) | Países Baixos(europe-west4) |
|---|---|---|
| DeepSeek-OCR | ||
| DeepSeek R1 (0528) | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi K2 Thinking | ||
| Llama 3.1 70B (pré-lançamento) | ||
| Llama 3.1 8B (pré-lançamento) | ||
| Llama 3.2 90B (pré-lançamento) | ||
| Llama 3.3 70B (pré-lançamento) | ||
| Llama 3.1 405B | ||
| Llama 4 Maverick 17B-128E (pré-lançamento) | ||
| Llama 4 Scout 17B-16E (pré-lançamento) | ||
| MiniMax M2 | ||
| Multilíngue E5 Large | ||
| E5 Small multilíngue | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
Ásia-Pacífico
| Modelo | Singapura(asia-southeast1) | Taiwan(asia-east1) |
|---|---|---|
| DeepSeek-OCR | ||
| DeepSeek R1 (0528) | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi K2 Thinking | ||
| Llama 3.1 70B (pré-lançamento) | ||
| Llama 3.1 8B (pré-lançamento) | ||
| Llama 3.2 90B (pré-lançamento) | ||
| Llama 3.3 70B (pré-lançamento) | ||
| Llama 3.1 405B | ||
| Llama 4 Maverick 17B-128E (pré-lançamento) | ||
| Llama 4 Scout 17B-16E (pré-lançamento) | ||
| MiniMax M2 | ||
| Multilíngue E5 Large | ||
| E5 Small multilíngue | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
A seguir
- Saiba mais sobre as regiões doGoogle Cloud .
Saiba mais sobre os controles de segurança por recurso.
Saiba mais sobre os modelos que oferecem suporte à IA generativa na Vertex AI. Consulte Referência do modelo de fundação da IA generativa.
Saiba mais sobre os locais da Vertex AI.