Despliegues y endpoints

Los modelos de Google y de partners, así como las funciones de IA generativa de Vertex AI, se exponen como endpoints regionales específicos y un endpoint global. Los endpoints globales cubren todo el mundo y ofrecen una disponibilidad y una fiabilidad mayores que las regiones únicas.

Endpoint global

Si seleccionas un endpoint global para tus solicitudes, puedes mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No utilices el endpoint global si tienes requisitos de procesamiento de aprendizaje automático, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de aprendizaje automático cuando se hace una solicitud.

Modelos admitidos

El uso del endpoint global está disponible para los siguientes modelos de Google en las regiones especificadas. Para obtener información sobre las regiones que admiten el endpoint global, consulta la pestaña Global de la tabla de ubicaciones de endpoints de modelos de Google.

Gemini 3 Flash (versión preliminar)
Gemini 3 Pro (versión preliminar)
Imagen de Gemini 3 Pro (versión preliminar)
Gemini 2.5 Pro
Gemini 2.5 Flash (versión preliminar)
Gemini 2.5 Flash-Lite (versión preliminar)
Gemini 2.5 Flash Image
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite
Gemini 2.0 Flash
Gemini 2.0 Flash Lite

Para obtener información sobre la disponibilidad de los endpoints globales de los modelos de partners, consulta la pestaña Global de la Google Cloud tabla de ubicaciones de los endpoints de los modelos de partners.

Usar el endpoint global

Para usar el endpoint global, excluye la ubicación del nombre del endpoint y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

En el caso del SDK de la IA generativa de Google, crea un cliente que use la ubicación global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

En el SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitaciones

Las siguientes funciones no están disponibles cuando se usa el endpoint global:

Ajuste
Predicción por lotes para modelos de Anthropic y OpenMaaS
Corpus de generación aumentada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del endpoint global con Provisioned Throughput solo está disponible para los siguientes modelos:

Modelo	Versión de modelo más reciente admitida
Gemini 3 Flash (versión preliminar)	`gemini-3-flash-preview`
Gemini 3 Pro (versión preliminar)	`gemini-3-pro-preview`
Imagen de Gemini 3 Pro (versión preliminar)	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash (versión preliminar)	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite (versión preliminar)	`gemini-2.5-flash-lite-preview-09-2025`
Gemini 2.5 Flash Image	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Ubicaciones de los endpoints de modelos de Google

Los endpoints de modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.

Estados Unidos

	Columbus (Ohio) (us-east5)	Dallas (Texas) (us-south1)	Iowa (us‑central1)	Las Vegas (Nevada, EE. UU.) (us-west4)	Moncks Corner (Carolina del Sur) (us-east1)	Norte de Virginia (us‑east4)	Oregón (us-west1)
Gemini 3 Pro (`gemini-3-pro-preview`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings de texto
Incrustaciones para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate experimental (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (versión preliminar) (`veo-3.0-generate-preview`)
Veo 3 Fast (versión preliminar) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (vista previa) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (vista previa) (`veo-3.1-fast-generate-preview`)
Chirp 3: transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
Síntesis de voz de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
Versión preliminar de Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Canadá

	Montreal (northamerica-northeast1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings de texto
Incrustaciones para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate experimental (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
Síntesis de voz de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
Versión preliminar de Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Sudamérica

	São Paulo, Brasil (southamerica-east1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings de texto
Incrustaciones para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate experimental (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
Síntesis de voz de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
Versión preliminar de Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Europa

	Países Bajos (europe-west4)	París, Francia (europe-west9)	Londres (Reino Unido) (europe-west2)	Fráncfort (Alemania) (europe-west3)	Bélgica (europe‑west1)	Zúrich (Suiza) (europe-west6)	Madrid, España (europe-southwest1)	Milán, Italia (europe-west8)	Finlandia (europe-north1)	Varsovia, Polonia (europe-central2)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings de texto
Incrustaciones para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate experimental (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
Síntesis de voz de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
Versión preliminar de Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Asia-Pacífico

	Tokio, Japón (asia-northeast1)	Sídney (Australia) (australia-southeast1)	Singapur (asia-southeast1)	Seúl (Corea del Sur) (asia-northeast3)	Taiwán (asia-east1)	Hong Kong (China) (asia-east2)	Bombay (India) (asia-south1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings de texto
Incrustaciones para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate experimental (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
Síntesis de voz de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
Versión preliminar de Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Oriente Próximo

	Dammam (Arabia Saudí) (me-central2)	Doha, Qatar (me-central1)	Tel Aviv (Israel) (me-west1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings de texto
Incrustaciones para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate experimental (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
Síntesis de voz de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
Versión preliminar de Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Global

	Global (global)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API Gemini Live (`gemini-live-2.5-flash-native-audio`)
Gemini 2.5 Flash Image (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Embeddings de texto
Incrustaciones para multimodal
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Imagen 4 Ultra Generate experimental (`imagen-4.0-ultra-generate-001`)
Chirp 3: transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
Síntesis de voz de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
Versión preliminar de Gemini 2.5 Flash Lite TTS (`gemini-2.5-flash-lite-preview-tts`)
Gemini 2.5 Pro TTS (`gemini-2.5-pro-tts`)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Google Cloud ubicaciones de endpoints de modelos de partners

Google sirve las solicitudes de la región que hayas especificado. En algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto de cuotas independiente del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Endpoint regional y global" en Modelos de partners de Vertex AI para MaaS.

Los endpoints de modelos de partners de la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

	Columbus (Ohio) (us-east5)	Dallas (Texas) (us-south1)	Iowa (us‑central1)	Las Vegas (Nevada, EE. UU.) (us-west4)	Moncks Corner (Carolina del Sur) (us-east1)	Norte de Virginia (us‑east4)	Oregón (us-west1)
Claude Opus 4.5 de Anthropic
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic (obsoleto)
Claude 3 Haiku de Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

	Países Bajos (europe-west4)	Bélgica (europe‑west1)
Claude Opus 4.5 de Anthropic
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic (obsoleto)
Claude 3 Haiku de Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asia-Pacífico

	Singapur (asia-southeast1)	Taiwán (asia-east1)
Claude Opus 4.5 de Anthropic
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic (obsoleto)
Claude 3 Haiku de Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

	Global (global)
Claude Opus 4.5 de Anthropic
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic (obsoleto)
Claude 3 Haiku de Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud ubicaciones de endpoints de modelos abiertos

Los endpoints de modelos abiertos de Generative AI en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

	Columbus (Ohio) (us-east5)	Dallas (Texas) (us-south1)	Iowa (us‑central1)	Las Vegas (Nevada, EE. UU.) (us-west4)	Moncks Corner (Carolina del Sur) (us-east1)	Norte de Virginia (us‑east4)	Oregón (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (versión preliminar)
Llama 3.1 70B (versión preliminar)
Llama 3.1 405B
Llama 3.2 90B (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (vista previa)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

	Países Bajos (europe-west4)	Bélgica (europe‑west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (versión preliminar)
Llama 3.1 70B (versión preliminar)
Llama 3.1 405B
Llama 3.2 90B (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (vista previa)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Asia-Pacífico

	Singapur (asia-southeast1)	Taiwán (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (versión preliminar)
Llama 3.1 70B (versión preliminar)
Llama 3.1 405B
Llama 3.2 90B (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (vista previa)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Global

	Global (global)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (versión preliminar)
Llama 3.1 70B (versión preliminar)
Llama 3.1 405B
Llama 3.2 90B (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (vista previa)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Siguientes pasos

Para ver un tutorial en un cuaderno que muestra el endpoint global, consulta Introducción al endpoint global de Vertex AI.
Consulta más información sobre la residencia de datos de Generative AI en Vertex AI.
Consulta información sobre las Google Cloud regiones.
Consulta más información sobre los controles de seguridad por función.
Consulta información sobre los modelos que ofrecen compatibilidad con la IA generativa en Vertex AI. Consulta la referencia del modelo fundamental de IA generativa.
Consulta información sobre las ubicaciones de Vertex AI.

Despliegues y endpoints Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Endpoint global

Modelos admitidos

Usar el endpoint global

Limitaciones

Ubicaciones de los endpoints de modelos de Google

Estados Unidos

Canadá

Sudamérica

Europa

Asia-Pacífico

Oriente Próximo

Global

Google Cloud ubicaciones de endpoints de modelos de partners

Estados Unidos

Europa

Asia-Pacífico

Global

Google Cloud ubicaciones de endpoints de modelos abiertos

Estados Unidos

Europa

Asia-Pacífico

Global

Siguientes pasos

Despliegues y endpoints