Implementaciones y extremos

Los modelos de Google y de socios, y las funciones de IA generativa en Vertex AI se exponen como extremos regionales específicos y un extremo global. Los extremos globales abarcan todo el mundo y proporcionan mayor disponibilidad y confiabilidad que las regiones individuales.

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No uses el extremo global si tienes requisitos de procesamiento de AA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de AA cuando se realiza una solicitud.

Modelos compatibles

El uso del extremo global es compatible con los siguientes modelos de Google en las regiones especificadas. Para obtener detalles sobre qué regiones admiten el extremo global, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de Google.

Gemini 3 Flash (Versión preliminar)
Gemini 3 Pro (versión preliminar)
Gemini 3 Pro Image (versión preliminar)
Gemini 2.5 Pro
Gemini 2.5 Flash (versión preliminar)
Gemini 2.5 Flash-Lite (versión preliminar)
Gemini 2.5 Flash Image
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

Para obtener información sobre la disponibilidad global de los extremos para los modelos de socios, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de sociosGoogle Cloud .

Usa el extremo global

Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de extremo global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para el SDK de IA generativa de Google, crea un cliente que use la ubicación global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

En el caso del SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitaciones

Las siguientes capacidades no están disponibles cuando se usa el extremo global:

Ajuste
Predicción por lotes para modelos de Anthropic y OpenMaaS
Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del extremo global con capacidad de procesamiento aprovisionada solo está disponible para los siguientes modelos:

Modelo	Versión del modelo compatible más reciente
Gemini 3 Flash (versión preliminar)	`gemini-3-flash-preview`
Gemini 3 Pro (versión preliminar)	`gemini-3-pro-preview`
Gemini 3 Pro Image (versión preliminar)	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash (vista previa)	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite (versión preliminar)	`gemini-2.5-flash-lite-preview-09-2025`
Gemini 2.5 Flash Image	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Ubicaciones de los extremos de los modelos de Google

Los extremos de los modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina del Sur (us-east1)	Virginia del Norte (us-east4)	Oregón (us-west1)
Gemini 3 Pro (`gemini-3-pro-preview`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash-native-audio`)
Imagen de Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Generación experimental con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Veo 2 (`veo-2.0-generate-001`)
Veo 3 (`veo-3.0-generate-001`)
Veo 3 Fast (`veo-3.0-fast-generate-001`)
Veo 3 (versión preliminar) (`veo-3.0-generate-preview`)
Veo 3 Fast (versión preliminar) (`veo-3.0-fast-generate-preview`)
Veo 3.1 (`veo-3.1-generate-001`)
Veo 3.1 Fast (`veo-3.1-fast-generate-001`)
Veo 3.1 (versión preliminar) (`veo-3.1-generate-preview`)
Veo 3.1 Fast (vista previa) (`veo-3.1-fast-generate-preview`)
Chirp 3: Transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
TTS de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
TTS de Gemini 2.5 Flash Lite Preview (`gemini-2.5-flash-lite-preview-tts`)
TTS de Gemini 2.5 Pro (`gemini-2.5-pro-tts`)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Canadá

	Montreal (northamerica-northeast1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash-native-audio`)
Imagen de Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Generación experimental con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
TTS de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
TTS de Gemini 2.5 Flash Lite Preview (`gemini-2.5-flash-lite-preview-tts`)
TTS de Gemini 2.5 Pro (`gemini-2.5-pro-tts`)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Brasil

	São Paulo (southamerica-east1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash-native-audio`)
Imagen de Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Generación experimental con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
TTS de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
TTS de Gemini 2.5 Flash Lite Preview (`gemini-2.5-flash-lite-preview-tts`)
TTS de Gemini 2.5 Pro (`gemini-2.5-pro-tts`)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Europa

	Países Bajos (europe-west4)	París, Francia (europe-west9)	Londres, Reino Unido (europe-west2)	Fráncfort, Alemania (europe-west3)	Bélgica (europe-west1)	Zúrich, Suiza (europe-west6)	Madrid, España (europe-southwest1)	Milán, Italia (europe-west8)	Finlandia (europe-north1)	Varsovia, Polonia (europe-central2)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash-native-audio`)
Imagen de Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Generación experimental con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
TTS de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
TTS de Gemini 2.5 Flash Lite Preview (`gemini-2.5-flash-lite-preview-tts`)
TTS de Gemini 2.5 Pro (`gemini-2.5-pro-tts`)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Asia-Pacífico

	Tokio, Japón (asia-northeast1)	Sídney, Australia (australia-southeast1)	Singapur (asia-southeast1)	Seúl, Corea (asia-northeast3)	Taiwán (asia-east1)	Hong Kong, China (asia-east2)	Bombay, India (asia-south1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash-native-audio`)
Imagen de Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Generación experimental con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
TTS de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
TTS de Gemini 2.5 Flash Lite Preview (`gemini-2.5-flash-lite-preview-tts`)
TTS de Gemini 2.5 Pro (`gemini-2.5-pro-tts`)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Oriente Medio

	Dammam, Arabia Saudita (me-central2)	Doha, Catar (me-central1)	Tel Aviv, Israel (me-west1)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash-native-audio`)
Imagen de Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Generación experimental con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
TTS de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
TTS de Gemini 2.5 Flash Lite Preview (`gemini-2.5-flash-lite-preview-tts`)
TTS de Gemini 2.5 Pro (`gemini-2.5-pro-tts`)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Global

	Global (global)
Gemini 3 Pro (`gemini-3-pro`)
Gemini 3 Pro Image (`gemini-3-pro-image-preview`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash`)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (`gemini-live-2.5-flash-native-audio`)
Imagen de Gemini 2.5 Flash (`gemini-2.5-flash-image`)
Gemini 2.5 Flash (`gemini-2.5-flash`)
Gemini 2.5 Pro (`gemini-2.5-pro`)
Gemini 2.5 Flash-Lite (`gemini-2.5-flash-lite`)
Gemini 2.0 Flash (`gemini-2.0-flash-001`)
Gemini 2.0 Flash-Lite (`gemini-2.0-flash-lite-001`)
Gemini Embeddings (`gemini-embedding-001`)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen (`imagegeneration@002`)
Imagen 2 (`imagegeneration@005`)
Imagen 2 (`imagegeneration@006`)
Imagen 3 (`imagen-3.0-generate-001`)
Imagen 3 Fast (`imagen-3.0-fast-generate-001`)
Edición y personalización de Imagen 3 (`imagen-3.0-capability-001`)
Imagen 3 (`imagen-3.0-generate-002`)
Imagen 4 (`imagen-4.0-generate-001`)
Imagen 4 (`imagen-4.0-fast-generate-001`)
Generación experimental con Imagen 4 Ultra (`imagen-4.0-ultra-generate-001`)
Chirp 3: Transcripción (`chirp_3`)
Chirp 2: Transcripción (`chirp_2`)
TTS de Gemini 2.5 Flash (`gemini-2.5-flash-tts`)
TTS de Gemini 2.5 Flash Lite Preview (`gemini-2.5-flash-lite-preview-tts`)
TTS de Gemini 2.5 Pro (`gemini-2.5-pro-tts`)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Google Cloud ubicaciones de extremos de modelos de socios

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto de cuotas independiente del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos de socios de Vertex AI para MaaS.

Los extremos de los modelos de socios para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina del Sur (us-east1)	Virginia del Norte (us-east4)	Oregón (us-west1)
Claude Opus 4.5 de Anthropic
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic (obsoleto)
Claude 3 Haiku de Anthropic
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Europa

	Países Bajos (europe-west4)	Bélgica (europe-west1)
Claude Opus 4.5 de Anthropic
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic (obsoleto)
Claude 3 Haiku de Anthropic
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Asia-Pacífico

	Singapur (asia-southeast1)	Taiwán (asia-east1)
Claude Opus 4.5 de Anthropic
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic (obsoleto)
Claude 3 Haiku de Anthropic
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Global

	Global (global)
Claude Opus 4.5 de Anthropic
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic (obsoleto)
Claude 3.5 Haiku de Anthropic (obsoleto)
Claude 3 Haiku de Anthropic
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24/7)
Codestral 2
Codestral (24.05)

Google Cloud ubicaciones de extremos de modelos abiertos

Los extremos de modelos abiertos para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

	Columbus, Ohio (us-east5)	Dallas, Texas (us-south1)	Iowa (us-central1)	Las Vegas, Nevada (us-west4)	Moncks Corner, Carolina del Sur (us-east1)	Virginia del Norte (us-east4)	Oregón (us-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (versión preliminar)
Llama 3.1 70B (versión preliminar)
Llama 3.1 405b
Llama 3.2 90B (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Europa

	Países Bajos (europe-west4)	Bélgica (europe-west1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (versión preliminar)
Llama 3.1 70B (versión preliminar)
Llama 3.1 405b
Llama 3.2 90B (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Asia-Pacífico

	Singapur (asia-southeast1)	Taiwán (asia-east1)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (versión preliminar)
Llama 3.1 70B (versión preliminar)
Llama 3.1 405b
Llama 3.2 90B (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

Global

	Global (global)
DeepSeek R1 (0528)
DeepSeek-OCR
DeepSeek-V3.1
GLM 4.7
gpt-oss 120B
gpt-oss 20B
Kimi K2 Thinking
Llama 3.1 8B (versión preliminar)
Llama 3.1 70B (versión preliminar)
Llama 3.1 405b
Llama 3.2 90B (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

¿Qué sigue?

Para ver un instructivo en notebook que muestre el extremo global, consulta Introducción al extremo global de Vertex AI.
Obtén más información sobre la residencia de datos de la IA generativa en Vertex AI.
Obtén más información sobre las regiones.Google Cloud
Obtén más información sobre los controles de seguridad por función.
Conoce los modelos que proporcionan asistencia para la generación generativa de Vertex AI. Consulta Referencia básica de modelos generativos de IA.
Obtén información sobre las ubicaciones de Vertex AI.

Implementaciones y extremos Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Extremo global

Modelos compatibles

Usa el extremo global

Limitaciones

Ubicaciones de los extremos de los modelos de Google

Estados Unidos

Canadá

Brasil

Europa

Asia-Pacífico

Oriente Medio

Global

Google Cloud ubicaciones de extremos de modelos de socios

Estados Unidos

Europa

Asia-Pacífico

Global

Google Cloud ubicaciones de extremos de modelos abiertos

Estados Unidos

Europa

Asia-Pacífico

Global

¿Qué sigue?

Implementaciones y extremos