Implementações e pontos finais

Os modelos da Google e de parceiros, bem como as funcionalidades de IA generativa na Vertex AI, são apresentados como endpoints regionais específicos e um endpoint global. Os pontos finais globais abrangem todo o mundo e oferecem maior disponibilidade e fiabilidade do que as regiões únicas.

Ponto final global

A seleção de um ponto final global para os seus pedidos pode melhorar a disponibilidade geral e reduzir os erros de recursos esgotados (429). Não use o ponto final global se tiver requisitos de processamento de ML, porque não pode controlar nem saber para que região os seus pedidos de processamento de ML são enviados quando é feito um pedido.

Modelos suportados

A utilização do ponto final global é suportada para os seguintes modelos Google nas regiões especificadas. Para ver detalhes sobre que regiões suportam o ponto final global, consulte o separador Global na tabela de localizações de pontos finais do modelo Google.

Gemini 3 Flash (pré-visualização)
Gemini 3 Pro (pré-visualização)
Gemini 3 Pro Image (pré-visualização)
Gemini 2.5 Pro
Gemini 2.5 Flash (pré-visualização)
Gemini 2.5 Flash-Lite (Pré-visualização)
Gemini 2.5 Flash Image
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

Para obter informações sobre a disponibilidade global de pontos finais para modelos de parceiros, consulte o separador Global na Google Cloud tabela de localizações de pontos finais de modelos de parceiros.

Use o ponto final global

Para usar o ponto final global, exclua a localização do nome do ponto final e configure a localização do recurso para global. Por exemplo, o seguinte é o URL do ponto final global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para o SDK Google Gen AI, crie um cliente que use a localização global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

Para o SDK Vertex AI for Python, inicialize o SDK com a localização global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitações

As seguintes capacidades não estão disponíveis quando usa o ponto final global:

Afinação
Previsão em lote para modelos da Anthropic e da OpenMaaS
Corpus de geração aumentada de obtenção (RAG) (os pedidos RAG são suportados)

A utilização do ponto final global com débito processado está disponível apenas para os seguintes modelos:

Modelo	Versão do modelo suportada mais recente
Gemini 3 Flash (pré-visualização)	`gemini-3-flash-preview`
Gemini 3 Pro (pré-visualização)	`gemini-3-pro-preview`
Gemini 3 Pro Image (pré-visualização)	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash (pré-visualização)	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite (pré-visualização)	`gemini-2.5-flash-lite-preview-09-2025`
Imagem do Gemini 2.5 Flash	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Localizações de pontos finais de modelos Google

Os pontos finais dos modelos Google para IA generativa no Vertex AI estão disponíveis nas seguintes regiões.

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Virgínia do Norte (us-east4)	Oregon (us-west1)
Gemini 3 Pro (`gemini-3-pro-preview`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Incorporações do Gemini (`gemini-embedding-001`)
Incorporações para texto
Incorporações para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (pré-visualização) (`veo-3.0-generate-preview`)
Veo 3 Fast (pré-visualização) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (pré-visualização) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (pré-visualização) (`veo-3.1-fast-generate-preview`)
Chirp 3: Transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Canadá

	Montreal (northamerica-northeast1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Incorporações do Gemini (`gemini-embedding-001`)
Incorporações para texto
Incorporações para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

América do Sul

	São Paulo, Brasil (southamerica-east1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Incorporações do Gemini (`gemini-embedding-001`)
Incorporações para texto
Incorporações para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Europa

	Países Baixos (europe-west4)	Paris, França (europe-west9)	Londres, Reino Unido (europe-west2)	Frankfurt, Alemanha (europe-west3)	Bélgica (europe-west1)	Zurique, Suíça (europe-west6)	Madrid, Espanha (europe-southwest1)	Milão, Itália (europe-west8)	Finlândia (europe-north1)	Varsóvia, Polónia (europe-central2)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Incorporações do Gemini (`gemini-embedding-001`)
Incorporações para texto
Incorporações para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Ásia-Pacífico

	Tóquio, Japão (asia-northeast1)	Sydney, Austrália (australia-southeast1)	Singapura (asia-southeast1)	Seul, Coreia (asia-northeast3)	Taiwan (asia-east1)	Hong Kong, China (asia-east2)	Mumbai, Índia (asia-south1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Incorporações do Gemini (`gemini-embedding-001`)
Incorporações para texto
Incorporações para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Médio Oriente

	Dammam, Arábia Saudita (me-central2)	Doha, Catar (me-central1)	Telavive, Israel (me-west1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Incorporações do Gemini (`gemini-embedding-001`)
Incorporações para texto
Incorporações para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Global

	Global (global)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Incorporações do Gemini (`gemini-embedding-001`)
Incorporações para texto
Incorporações para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edição e personalização do Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Geração experimental do Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcrição (`chirp_3`)
Chirp 2: transcrição (`chirp_2`)
Gemini 2.5 Flash TTS (`gemini-2.5-flash-tts`)
Gemini 2.5 Flash Lite Preview TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: vozes HD
Chirp 3: voz personalizada instantânea

Google Cloud localizações de pontos finais do modelo de parceiro

A Google publica pedidos da região que especificou. Para alguns modelos, a Google também oferece um ponto final global para melhorar a disponibilidade geral e reduzir as taxas de erro. O ponto final global pode ter um conjunto separado de quotas do ponto final regional e não suporta requisitos de residência de dados. Para mais informações, consulte a secção "Ponto final regional e global" em Modelos de parceiros da Vertex AI para MaaS.

Os pontos finais dos modelos de parceiros para a IA generativa no Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Virgínia do Norte (us-east4)	Oregon (us-west1)
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus da Anthropic 4
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Claude 3 Haiku da Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

	Países Baixos (europe-west4)	Bélgica (europe-west1)
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5
Claude Opus da Anthropic 4
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Claude 3 Haiku da Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Ásia-Pacífico

	Singapura (asia-southeast1)	Taiwan (asia-east1)
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus da Anthropic 4
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Claude 3 Haiku da Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

	Global (global)
Claude Opus 4.5 da Anthropic
Claude Sonnet 4.5 da Anthropic
Claude Opus 4.1 da Anthropic
Claude Haiku 4.5 da Anthropic
Claude Opus da Anthropic 4
Claude Sonnet 4 da Anthropic
Claude 3.7 Sonnet da Anthropic (descontinuado)
Claude 3.5 Haiku da Anthropic (descontinuado)
Claude 3 Haiku da Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud localizações de pontos finais de modelos abertos

Os pontos finais de modelos abertos para IA generativa no Vertex AI estão disponíveis nas seguintes regiões:

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina do Sul (us-east1)	Virgínia do Norte (us-east4)	Oregon (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-visualização)
Llama 3.1 70B (pré-visualização)
Llama 3.1 405B
Llama 3.2 90B (pré-visualização)
Llama 3.3 70B (pré-visualização)
Llama 4 Maverick 17B-128E (pré-visualização)
Llama 4 Scout 17B-16E (pré-visualização)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

	Países Baixos (europe-west4)	Bélgica (europe-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-visualização)
Llama 3.1 70B (pré-visualização)
Llama 3.1 405B
Llama 3.2 90B (pré-visualização)
Llama 3.3 70B (pré-visualização)
Llama 4 Maverick 17B-128E (pré-visualização)
Llama 4 Scout 17B-16E (pré-visualização)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Ásia-Pacífico

	Singapura (asia-southeast1)	Taiwan (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-visualização)
Llama 3.1 70B (pré-visualização)
Llama 3.1 405B
Llama 3.2 90B (pré-visualização)
Llama 3.3 70B (pré-visualização)
Llama 4 Maverick 17B-128E (pré-visualização)
Llama 4 Scout 17B-16E (pré-visualização)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Global

	Global (global)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (pré-visualização)
Llama 3.1 70B (pré-visualização)
Llama 3.1 405B
Llama 3.2 90B (pré-visualização)
Llama 3.3 70B (pré-visualização)
Llama 4 Maverick 17B-128E (pré-visualização)
Llama 4 Scout 17B-16E (pré-visualização)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

O que se segue?

Para um tutorial de bloco de notas que demonstra o ponto final global, consulte o artigo Introdução ao ponto final global do Vertex AI.
Saiba mais sobre a residência de dados da IA generativa no Vertex AI.
Saiba mais sobre as Google Cloud regiões.
Saiba mais sobre os controlos de segurança por funcionalidade.
Saiba mais sobre os modelos que oferecem suporte de IA generativa no Vertex AI. Consulte a referência do modelo base de IA generativa.
Saiba mais sobre as localizações do Vertex AI.

Implementações e pontos finais Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Ponto final global

Modelos suportados

Use o ponto final global

Limitações

Localizações de pontos finais de modelos Google

Estados Unidos

Canadá

América do Sul

Europa

Ásia-Pacífico

Médio Oriente

Global

Google Cloud localizações de pontos finais do modelo de parceiro

Estados Unidos

Europa

Ásia-Pacífico

Global

Google Cloud localizações de pontos finais de modelos abertos

Estados Unidos

Europa

Ásia-Pacífico

Global

O que se segue?

Implementações e pontos finais