Os modelos da Google e de parceiros, bem como as funcionalidades de IA generativa na Vertex AI, são expostos como endpoints regionais específicos e um endpoint global. Os pontos finais globais abrangem todo o mundo e oferecem maior disponibilidade e fiabilidade do que as regiões únicas.
Ponto final global
A seleção de um ponto final global para os seus pedidos pode melhorar a disponibilidade geral e reduzir os erros de recursos esgotados (429). Não use o ponto final global se tiver requisitos de processamento de ML, porque não pode controlar nem saber para que região os seus pedidos de processamento de ML são enviados quando é feito um pedido.
Modelos suportados
A utilização do ponto final global é suportada para os seguintes modelos Google nas regiões especificadas. Para ver detalhes sobre que regiões suportam o ponto final global, consulte o separador Global na tabela de localizações de pontos finais do modelo Google.
- Gemini 3 Pro (pré-visualização)
- Gemini 3 Pro Image (pré-visualização)
- Gemini 2.5 Pro
- Gemini 2.5 Flash (pré-visualização)
- Gemini 2.5 Flash-Lite (Pré-visualização)
- Gemini 2.5 Flash Image
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.0 Flash com geração de imagens (Pré-visualização)
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Para obter informações sobre a disponibilidade global de pontos finais para modelos de parceiros, consulte o separador Global na Google Cloud tabela de localizações de pontos finais de modelos de parceiros.
Use o ponto final global
Para usar o ponto final global, exclua a localização do nome do ponto final e configure a localização do recurso para global. Por exemplo, o seguinte é o URL do ponto final global:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Para o SDK Google Gen AI, crie um cliente que use a localização global:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Para o SDK Vertex AI for Python,
inicialize o SDK com a localização global:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitações
As seguintes capacidades não estão disponíveis quando usa o ponto final global:
- Afinação
- Previsão em lote para modelos da Anthropic e OpenMaaS
- Corpus de geração aumentada por obtenção (RAG) (os pedidos RAG são suportados)
A utilização do ponto final global com débito processado está disponível apenas para os seguintes modelos:
| Modelo | Versão do modelo suportada mais recente |
|---|---|
| Gemini 3 Pro (pré-visualização) | gemini-3-pro-preview |
| Gemini 3 Pro Image (pré-visualização) | gemini-3-pro-image-preview |
| Gemini 2.5 Pro | gemini-2.5-pro |
| Gemini 2.5 Flash (pré-visualização) | gemini-2.5-flash-preview-09-2025 |
| Gemini 2.5 Flash-Lite (pré-visualização) | gemini-2.5-flash-lite-preview-09-2025 |
| Gemini 2.5 Flash Image | gemini-2.5-flash-image |
| Gemini 2.5 Flash | gemini-2.5-flash |
| Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
| Gemini 2.0 Flash | gemini-2.0-flash-001 |
| Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Localizações de pontos finais de modelos Google
Os pontos finais dos modelos Google para IA generativa no Vertex AI estão disponíveis nas seguintes regiões.
Estados Unidos
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina do Sul (us-east1) | Virgínia do Norte (us-east4) | Oregon (us-west1) | |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||||||
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|||||||
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||||||
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio) |
|||||||
| Gemini 2.5 Flash Image ( gemini-2.5-flash-image) |
|||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||||||
| Incorporações do Gemini ( gemini-embedding-001) |
|||||||
| Incorporações para texto | |||||||
| Incorporações para multimodal | |||||||
| Imagen ( imagegeneration@002) |
|||||||
| Imagen 2 ( imagegeneration@005) |
|||||||
| Imagen 2 ( imagegeneration@006) |
|||||||
| Imagen 3 ( imagen-3.0-generate-001) |
|||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||||||
| Edição e personalização do Imagen 3 ( imagen-3.0-capability-001) |
|||||||
| Imagen 3 ( imagen-3.0-generate-002) |
|||||||
| Imagen 4
( imagen-4.0-generate-001) |
|||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||||||
| Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001) |
|||||||
| Veo 2
( veo-2.0-generate-001) |
|||||||
| Veo 3
( veo-3.0-generate-001) |
|||||||
| Veo 3 Fast
( veo-3.0-fast-generate-001) |
|||||||
| Veo 3 (pré-visualização)
( veo-3.0-generate-preview) |
|||||||
| Veo 3 Fast (pré-visualização)
( veo-3.0-fast-generate-preview) |
|||||||
| Veo 3.1
( veo-3.1-generate-001) |
|||||||
| Veo 3.1 Fast
( veo-3.1-fast-generate-001) |
|||||||
| Veo 3.1 (pré-visualização)
( veo-3.1-generate-preview) |
|||||||
| Veo 3.1 Fast (pré-visualização)
( veo-3.1-fast-generate-preview) |
|||||||
Chirp 3: Transcrição (chirp_3) |
|||||||
Chirp 2: transcrição (chirp_2) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|||||||
| Chirp 3: vozes HD | |||||||
| Chirp 3: voz personalizada instantânea |
Canadá
| Montreal (northamerica-northeast1) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Gemini 2.5 Flash Image ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Incorporações do Gemini ( gemini-embedding-001) |
|
| Incorporações para texto | |
| Incorporações para multimodal | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Edição e personalização do Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001) |
|
Chirp 3: Transcrição (chirp_3) |
|
Chirp 2: transcrição (chirp_2) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|
| Chirp 3: vozes HD | |
| Chirp 3: voz personalizada instantânea |
América do Sul
| São Paulo, Brasil (southamerica-east1) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Gemini 2.5 Flash Image ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Incorporações do Gemini ( gemini-embedding-001) |
|
| Incorporações para texto | |
| Incorporações para multimodal | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Edição e personalização do Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001) |
|
Chirp 3: Transcrição (chirp_3) |
|
Chirp 2: transcrição (chirp_2) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|
| Chirp 3: vozes HD | |
| Chirp 3: voz personalizada instantânea |
Europa
| Países Baixos (europe-west4) | Paris, França (europe-west9) | Londres, Reino Unido (europe-west2) | Frankfurt, Alemanha (europe-west3) | Bélgica (europe-west1) | Zurique, Suíça (europe-west6) | Madrid, Espanha (europe-southwest1) | Milão, Itália (europe-west8) | Finlândia (europe-north1) | Varsóvia, Polónia (europe-central2) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
||||||||||
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
||||||||||
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
||||||||||
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio) |
||||||||||
| Gemini 2.5 Flash Image ( gemini-2.5-flash-image) |
||||||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
||||||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
||||||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
||||||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
||||||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
||||||||||
| Incorporações do Gemini ( gemini-embedding-001) |
||||||||||
| Incorporações para texto | ||||||||||
| Incorporações para multimodal | ||||||||||
| Imagen ( imagegeneration@002) |
||||||||||
| Imagen 2 ( imagegeneration@005) |
||||||||||
| Imagen 2 ( imagegeneration@006) |
||||||||||
| Imagen 3 ( imagen-3.0-generate-001) |
||||||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
||||||||||
| Edição e personalização do Imagen 3 ( imagen-3.0-capability-001) |
||||||||||
| Imagen 3 ( imagen-3.0-generate-002) |
||||||||||
| Imagen 4
( imagen-4.0-generate-001) |
||||||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
||||||||||
| Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001) |
||||||||||
Chirp 3: Transcrição (chirp_3) |
||||||||||
Chirp 2: transcrição (chirp_2) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
||||||||||
| Chirp 3: vozes HD | ||||||||||
| Chirp 3: voz personalizada instantânea |
Ásia-Pacífico
| Tóquio, Japão (asia-northeast1) | Sydney, Austrália (australia-southeast1) | Singapura (asia-southeast1) | Seul, Coreia (asia-northeast3) | Taiwan (asia-east1) | Hong Kong, China (asia-east2) | Mumbai, Índia (asia-south1) | |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||||||
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|||||||
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||||||
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio) |
|||||||
| Gemini 2.5 Flash Image ( gemini-2.5-flash-image) |
|||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||||||
| Incorporações do Gemini ( gemini-embedding-001) |
|||||||
| Incorporações para texto | |||||||
| Incorporações para multimodal | |||||||
| Imagen ( imagegeneration@002) |
|||||||
| Imagen 2 ( imagegeneration@005) |
|||||||
| Imagen 2 ( imagegeneration@006) |
|||||||
| Imagen 3 ( imagen-3.0-generate-001) |
|||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||||||
| Edição e personalização do Imagen 3 ( imagen-3.0-capability-001) |
|||||||
| Imagen 3 ( imagen-3.0-generate-002) |
|||||||
| Imagen 4
( imagen-4.0-generate-001) |
|||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||||||
| Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001) |
|||||||
Chirp 3: Transcrição (chirp_3) |
|||||||
Chirp 2: transcrição (chirp_2) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|||||||
| Chirp 3: vozes HD | |||||||
| Chirp 3: voz personalizada instantânea |
Médio Oriente
| Dammam, Arábia Saudita (me-central2) | Doha, Catar (me-central1) | Telavive, Israel (me-west1) | |
|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|||
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio) |
|||
| Gemini 2.5 Flash Image ( gemini-2.5-flash-image) |
|||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||
| Incorporações do Gemini ( gemini-embedding-001) |
|||
| Incorporações para texto | |||
| Incorporações para multimodal | |||
| Imagen ( imagegeneration@002) |
|||
| Imagen 2 ( imagegeneration@005) |
|||
| Imagen 2 ( imagegeneration@006) |
|||
| Imagen 3 ( imagen-3.0-generate-001) |
|||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||
| Edição e personalização do Imagen 3 ( imagen-3.0-capability-001) |
|||
| Imagen 3 ( imagen-3.0-generate-002) |
|||
| Imagen 4
( imagen-4.0-generate-001) |
|||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||
| Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001) |
|||
Chirp 3: Transcrição (chirp_3) |
|||
Chirp 2: transcrição (chirp_2) |
|||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|||
| Chirp 3: vozes HD | |||
| Chirp 3: voz personalizada instantânea |
Global
| Global (global) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash com áudio nativo da API Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Gemini 2.5 Flash Image ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Incorporações do Gemini ( gemini-embedding-001) |
|
| Incorporações para texto | |
| Incorporações para multimodal | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Edição e personalização do Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001) |
|
Chirp 3: Transcrição (chirp_3) |
|
Chirp 2: transcrição (chirp_2) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts) |
|
| Chirp 3: vozes HD | |
| Chirp 3: voz personalizada instantânea |
Google Cloud localizações de pontos finais do modelo de parceiro
A Google publica pedidos da região que especificou. Para alguns modelos, a Google também oferece um ponto final global para melhorar a disponibilidade geral e reduzir as taxas de erro. O ponto final global pode ter um conjunto separado de quotas do ponto final regional e não suporta requisitos de residência de dados. Para mais informações, consulte a secção "Ponto final regional e global" em Modelos de parceiros da Vertex AI para MaaS.
Os endpoints de modelos de parceiros para IA generativa no Vertex AI estão disponíveis nas seguintes regiões:
Estados Unidos
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina do Sul (us-east1) | Virgínia do Norte (us-east4) | Oregon (us-west1) | |
|---|---|---|---|---|---|---|---|
| Claude Opus 4.5 da Anthropic | |||||||
| Claude Sonnet 4.5 da Anthropic | |||||||
| Claude Opus 4.1 da Anthropic | |||||||
| Claude Haiku 4.5 da Anthropic | |||||||
| Claude Opus da Anthropic 4 | |||||||
| Claude Sonnet 4 da Anthropic | |||||||
| Claude 3.7 Sonnet da Anthropic (descontinuado) | |||||||
| Claude 3.5 Haiku da Anthropic | |||||||
| Claude 3 Haiku da Anthropic | |||||||
| Mistral Medium 3 | |||||||
| Mistral OCR (25.05) | |||||||
| Mistral Small 3.1 (25/03) | |||||||
| Mistral Large (24.07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) |
Europa
| Países Baixos (europe-west4) | Bélgica (europe-west1) | |
|---|---|---|
| Claude Opus 4.5 da Anthropic | ||
| Claude Sonnet 4.5 da Anthropic | ||
| Claude Opus 4.1 da Anthropic | ||
| Claude Haiku 4.5 | ||
| Claude Opus da Anthropic 4 | ||
| Claude Sonnet 4 da Anthropic | ||
| Claude 3.7 Sonnet da Anthropic (descontinuado) | ||
| Claude 3.5 Haiku da Anthropic | ||
| Claude 3 Haiku da Anthropic | ||
| Mistral Medium 3 | ||
| Mistral OCR (25.05) | ||
| Mistral Small 3.1 (25/03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Ásia-Pacífico
| Singapura (asia-southeast1) | Taiwan (asia-east1) | |
|---|---|---|
| Claude Opus 4.5 da Anthropic | ||
| Claude Sonnet 4.5 da Anthropic | ||
| Claude Opus 4.1 da Anthropic | ||
| Claude Haiku 4.5 da Anthropic | ||
| Claude Opus da Anthropic 4 | ||
| Claude Sonnet 4 da Anthropic | ||
| Claude 3.7 Sonnet da Anthropic (descontinuado) | ||
| Claude 3.5 Haiku da Anthropic | ||
| Claude 3 Haiku da Anthropic | ||
| Mistral Medium 3 | ||
| Mistral OCR (25.05) | ||
| Mistral Small 3.1 (25/03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Global
| Global (global) | ||
|---|---|---|
| Claude Opus 4.5 da Anthropic | ||
| Claude Sonnet 4.5 da Anthropic | ||
| Claude Opus 4.1 da Anthropic | ||
| Claude Haiku 4.5 da Anthropic | ||
| Claude Opus da Anthropic 4 | ||
| Claude Sonnet 4 da Anthropic | ||
| Claude 3.7 Sonnet da Anthropic (descontinuado) | ||
| Claude 3.5 Haiku da Anthropic | ||
| Claude 3 Haiku da Anthropic | ||
| Mistral Medium 3 | ||
| Mistral OCR (25.05) | ||
| Mistral Small 3.1 (25/03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Google Cloud localizações de pontos finais de modelos abertos
A Google publica pedidos da região que especificou. Para alguns modelos, a Google também oferece um ponto final global para melhorar a disponibilidade geral e reduzir as taxas de erro. O ponto final global pode ter um conjunto separado de quotas do ponto final regional e não suporta requisitos de residência de dados. Para mais informações, consulte a secção "Ponto final regional e global" em Modelos abertos da Vertex AI para MaaS.
Os pontos finais de modelos abertos para IA generativa no Vertex AI estão disponíveis nas seguintes regiões:
Estados Unidos
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina do Sul (us-east1) | Virgínia do Norte (us-east4) | Oregon (us-west1) | |
|---|---|---|---|---|---|---|---|
| DeepSeek R1 (0528) | |||||||
| DeepSeek-OCR | |||||||
| DeepSeek-V3.1 | |||||||
| gpt-oss 120B | |||||||
| gpt-oss 20B | |||||||
| Kimi K2 Thinking | |||||||
| Llama 3.1 8B (pré-visualização) | |||||||
| Llama 3.1 70B (pré-visualização) | |||||||
| Llama 3.1 405B | |||||||
| Llama 3.2 90B (pré-visualização) | |||||||
| Llama 3.3 70B (pré-visualização) | |||||||
| Llama 4 Maverick 17B-128E (pré-visualização) | |||||||
| Llama 4 Scout 17B-16E (pré-visualização) | |||||||
| MiniMax M2 | |||||||
| Multilingual E5 Large | |||||||
| Multilingual E5 Small | |||||||
| Qwen3 235B | |||||||
| Qwen3 Coder | |||||||
| Qwen3-Next-80B Instruct | |||||||
| Qwen3-Next-80B Thinking |
Europa
| Países Baixos (europe-west4) | Bélgica (europe-west1) | |
|---|---|---|
| DeepSeek R1 (0528) | ||
| DeepSeek-OCR | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi K2 Thinking | ||
| Llama 3.1 8B (pré-visualização) | ||
| Llama 3.1 70B (pré-visualização) | ||
| Llama 3.1 405B | ||
| Llama 3.2 90B (pré-visualização) | ||
| Llama 3.3 70B (pré-visualização) | ||
| Llama 4 Maverick 17B-128E (pré-visualização) | ||
| Llama 4 Scout 17B-16E (pré-visualização) | ||
| MiniMax M2 | ||
| Multilingual E5 Large | ||
| Multilingual E5 Small | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
Ásia-Pacífico
| Singapura (asia-southeast1) | Taiwan (asia-east1) | |
|---|---|---|
| DeepSeek R1 (0528) | ||
| DeepSeek-OCR | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi K2 Thinking | ||
| Llama 3.1 8B (pré-visualização) | ||
| Llama 3.1 70B (pré-visualização) | ||
| Llama 3.1 405B | ||
| Llama 3.2 90B (pré-visualização) | ||
| Llama 3.3 70B (pré-visualização) | ||
| Llama 4 Maverick 17B-128E (pré-visualização) | ||
| Llama 4 Scout 17B-16E (pré-visualização) | ||
| MiniMax M2 | ||
| Multilingual E5 Large | ||
| Multilingual E5 Small | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
Global
| Global (global) | |
|---|---|
| DeepSeek R1 (0528) | |
| DeepSeek-OCR | |
| DeepSeek-V3.1 | |
| gpt-oss 120B | |
| gpt-oss 20B | |
| Kimi K2 Thinking | |
| Llama 3.1 8B (pré-visualização) | |
| Llama 3.1 70B (pré-visualização) | |
| Llama 3.1 405B | |
| Llama 3.2 90B (pré-visualização) | |
| Llama 3.3 70B (pré-visualização) | |
| Llama 4 Maverick 17B-128E (pré-visualização) | |
| Llama 4 Scout 17B-16E (pré-visualização) | |
| MiniMax M2 | |
| Multilingual E5 Large | |
| Multilingual E5 Small | |
| Qwen3 235B | |
| Qwen3 Coder | |
| Qwen3-Next-80B Instruct | |
| Qwen3-Next-80B Thinking |
O que se segue?
- Para um tutorial de bloco de notas que demonstra o ponto final global, consulte o artigo Introdução ao ponto final global do Vertex AI.
- Saiba mais sobre a residência de dados da IA generativa no Vertex AI.
- Saiba mais sobre as Google Cloud regiões.
- Saiba mais sobre os controlos de segurança por funcionalidade.
- Saiba mais sobre os modelos que oferecem suporte de IA generativa no Vertex AI. Consulte a referência do modelo base de IA generativa.
- Saiba mais sobre as localizações do Vertex AI.