Implementações e pontos finais

Os modelos da Google e de parceiros, bem como as funcionalidades de IA generativa na Vertex AI, são expostos como endpoints regionais específicos e um endpoint global. Os pontos finais globais abrangem todo o mundo e oferecem maior disponibilidade e fiabilidade do que as regiões únicas.

Ponto final global

A seleção de um ponto final global para os seus pedidos pode melhorar a disponibilidade geral e reduzir os erros de recursos esgotados (429). Não use o ponto final global se tiver requisitos de processamento de ML, porque não pode controlar nem saber para que região os seus pedidos de processamento de ML são enviados quando é feito um pedido.

Modelos suportados

A utilização do ponto final global é suportada para os seguintes modelos Google nas regiões especificadas. Para ver detalhes sobre que regiões suportam o ponto final global, consulte o separador Global na tabela de localizações de pontos finais do modelo Google.

Para obter informações sobre a disponibilidade global de pontos finais para modelos de parceiros, consulte o separador Global na Google Cloud tabela de localizações de pontos finais de modelos de parceiros.

Use o ponto final global

Para usar o ponto final global, exclua a localização do nome do ponto final e configure a localização do recurso para global. Por exemplo, o seguinte é o URL do ponto final global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK Google Gen AI, crie um cliente que use a localização global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Para o SDK Vertex AI for Python, inicialize o SDK com a localização global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitações

As seguintes capacidades não estão disponíveis quando usa o ponto final global:

  • Afinação
  • Previsão em lote para modelos da Anthropic e OpenMaaS
  • Corpus de geração aumentada por obtenção (RAG) (os pedidos RAG são suportados)

A utilização do ponto final global com débito processado está disponível apenas para os seguintes modelos:

Modelo Versão do modelo suportada mais recente
Gemini 3 Pro (pré-visualização) gemini-3-pro-preview
Gemini 3 Pro Image (pré-visualização) gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash (pré-visualização) gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite (pré-visualização) gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Localizações de pontos finais de modelos Google

Os pontos finais dos modelos Google para IA generativa no Vertex AI estão disponíveis nas seguintes regiões.

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina do Sul (us-east1) Virgínia do Norte (us-east4) Oregon (us-west1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Incorporações do Gemini
(gemini-embedding-001)
Incorporações para texto
Incorporações para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (pré-visualização)
(veo-3.0-generate-preview)
Veo 3 Fast (pré-visualização)
(veo-3.0-fast-generate-preview)
Veo 3.1
(veo-3.1-generate-001)
Veo 3.1 Fast
(veo-3.1-fast-generate-001)
Veo 3.1 (pré-visualização)
(veo-3.1-generate-preview)
Veo 3.1 Fast (pré-visualização)
(veo-3.1-fast-generate-preview)
Chirp 3: Transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Canadá

Montreal (northamerica-northeast1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Incorporações do Gemini
(gemini-embedding-001)
Incorporações para texto
Incorporações para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

América do Sul

São Paulo, Brasil (southamerica-east1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Incorporações do Gemini
(gemini-embedding-001)
Incorporações para texto
Incorporações para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Europa

Países Baixos (europe-west4) Paris, França (europe-west9) Londres, Reino Unido (europe-west2) Frankfurt, Alemanha (europe-west3) Bélgica (europe-west1) Zurique, Suíça (europe-west6) Madrid, Espanha (europe-southwest1) Milão, Itália (europe-west8) Finlândia (europe-north1) Varsóvia, Polónia (europe-central2)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Incorporações do Gemini
(gemini-embedding-001)
Incorporações para texto
Incorporações para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Ásia-Pacífico

Tóquio, Japão (asia-northeast1) Sydney, Austrália (australia-southeast1) Singapura (asia-southeast1) Seul, Coreia (asia-northeast3) Taiwan (asia-east1) Hong Kong, China (asia-east2) Mumbai, Índia (asia-south1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Incorporações do Gemini
(gemini-embedding-001)
Incorporações para texto
Incorporações para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Médio Oriente

Dammam, Arábia Saudita (me-central2) Doha, Catar (me-central1) Telavive, Israel (me-west1)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Incorporações do Gemini
(gemini-embedding-001)
Incorporações para texto
Incorporações para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Global

Global (global)
Gemini 3 Pro
(gemini-3-pro)
Gemini 3 Pro Image
(gemini-3-pro-image-preview)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash com áudio nativo da API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Incorporações do Gemini
(gemini-embedding-001)
Incorporações para texto
Incorporações para multimodal
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edição e personalização do Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcrição (chirp_3)
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Google Cloud localizações de pontos finais do modelo de parceiro

A Google publica pedidos da região que especificou. Para alguns modelos, a Google também oferece um ponto final global para melhorar a disponibilidade geral e reduzir as taxas de erro. O ponto final global pode ter um conjunto separado de quotas do ponto final regional e não suporta requisitos de residência de dados. Para mais informações, consulte a secção "Ponto final regional e global" em Modelos de parceiros da Vertex AI para MaaS.

Os endpoints de modelos de parceiros para IA generativa no Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina do Sul (us-east1) Virgínia do Norte (us-east4) Oregon (us-west1)
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus da Anthropic 4
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic
Claude 3 Haiku da Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

Países Baixos (europe-west4) Bélgica (europe-west1)
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5
Claude Opus da Anthropic 4
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic
Claude 3 Haiku da Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Ásia-Pacífico

Singapura (asia-southeast1) Taiwan (asia-east1)
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus da Anthropic 4
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic
Claude 3 Haiku da Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

Global (global)
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus da Anthropic 4
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic
Claude 3 Haiku da Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud localizações de pontos finais de modelos abertos

A Google publica pedidos da região que especificou. Para alguns modelos, a Google também oferece um ponto final global para melhorar a disponibilidade geral e reduzir as taxas de erro. O ponto final global pode ter um conjunto separado de quotas do ponto final regional e não suporta requisitos de residência de dados. Para mais informações, consulte a secção "Ponto final regional e global" em Modelos abertos da Vertex AI para MaaS.

Os pontos finais de modelos abertos para IA generativa no Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina do Sul (us-east1) Virgínia do Norte (us-east4) Oregon (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-visualização)
Llama 3.1 70B (pré-visualização)
Llama 3.1 405B
Llama 3.2 90B (pré-visualização)
Llama 3.3 70B (pré-visualização)
Llama 4 Maverick 17B-128E (pré-visualização)
Llama 4 Scout 17B-16E (pré-visualização)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

Países Baixos (europe-west4) Bélgica (europe-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-visualização)
Llama 3.1 70B (pré-visualização)
Llama 3.1 405B
Llama 3.2 90B (pré-visualização)
Llama 3.3 70B (pré-visualização)
Llama 4 Maverick 17B-128E (pré-visualização)
Llama 4 Scout 17B-16E (pré-visualização)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Ásia-Pacífico

Singapura (asia-southeast1) Taiwan (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-visualização)
Llama 3.1 70B (pré-visualização)
Llama 3.1 405B
Llama 3.2 90B (pré-visualização)
Llama 3.3 70B (pré-visualização)
Llama 4 Maverick 17B-128E (pré-visualização)
Llama 4 Scout 17B-16E (pré-visualização)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Global

Global (global)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-visualização)
Llama 3.1 70B (pré-visualização)
Llama 3.1 405B
Llama 3.2 90B (pré-visualização)
Llama 3.3 70B (pré-visualização)
Llama 4 Maverick 17B-128E (pré-visualização)
Llama 4 Scout 17B-16E (pré-visualização)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

O que se segue?