Implementaciones y extremos

Los modelos de Google y de socios, y las funciones de IA generativa en Vertex AI se exponen como extremos regionales específicos y un extremo global. Los extremos globales abarcan todo el mundo y proporcionan mayor disponibilidad y confiabilidad que las regiones individuales.

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No uses el extremo global si tienes requisitos de procesamiento de AA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de AA cuando se realiza una solicitud.

Modelos compatibles

El uso del extremo global es compatible con los siguientes modelos de Google en las regiones especificadas. Para obtener detalles sobre qué regiones admiten el extremo global, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de Google.

Gemini 3 Flash (versión preliminar)
Gemini 3 Pro (versión preliminar)
Gemini 3 Pro Image (versión preliminar)
Gemini 2.5 Pro
Gemini 2.5 Flash (versión preliminar)
Gemini 2.5 Flash-Lite (versión preliminar)
Gemini 2.5 Flash Image
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

Para obtener información sobre la disponibilidad global de los extremos para los modelos de socios, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de sociosGoogle Cloud .

Usa el extremo global

Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de extremo global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para el SDK de IA generativa de Google, crea un cliente que use la ubicación global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

En el caso del SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitaciones

Las siguientes capacidades no están disponibles cuando se usa el extremo global:

Ajuste
Predicción por lotes para modelos de Anthropic y OpenMaaS
Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del extremo global con la capacidad de procesamiento aprovisionada solo está disponible para los siguientes modelos:

Haz clic para ver los modelos compatibles con el extremo global cuando se usa la capacidad de procesamiento aprovisionada.

Modelo	Versión del modelo compatible más reciente
Gemini 3 Flash vista previa	`gemini-3-flash-preview`
Gemini 3 Pro versión preliminar	`gemini-3-pro-preview`
Imagen de Gemini 3 Pro vista previa	`gemini-3-pro-image-preview`
Gemini 2.5 Pro	`gemini-2.5-pro`
Gemini 2.5 Flash vista previa	`gemini-2.5-flash-preview-09-2025`
Gemini 2.5 Flash-Lite vista previa	`gemini-2.5-flash-lite-preview-09-2025`
Gemini 2.5 Flash Image	`gemini-2.5-flash-image`
Gemini 2.5 Flash	`gemini-2.5-flash`
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`
Gemini 2.0 Flash	`gemini-2.0-flash-001`
Gemini 2.0 Flash-Lite	`gemini-2.0-flash-lite-001`

Ubicaciones de los extremos de los modelos de Google

Los modelos de Google en Vertex AI están disponibles para los siguientes extremos:

Global

	Global(global)
Modelos de Gemini
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Gemini 3 Pro vista previa `(gemini-3-pro-preview)`
Imagen de Gemini 3 Pro vista previa `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Gemini Embeddings `(gemini-embeddings-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Imagen 3: Personalización controlada `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Imagen 4 de Ultra Generate `(imagen-4.0-ultra-generate-001)`
Modelos de Veo en Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate vista previa `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Estados Unidos

	Oregón(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina del Sur(us-east1)	N. Virginia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos de Gemini
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Gemini 3 Pro vista previa `(gemini-3-pro-preview)`
Imagen de Gemini 3 Pro vista previa `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Gemini Embeddings `(gemini-embeddings-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Imagen 3: Personalización controlada `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Imagen 4 de Ultra Generate `(imagen-4.0-ultra-generate-001)`
Modelos de Veo en Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate vista previa `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

América

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos de Gemini
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Gemini 3 Pro vista previa `(gemini-3-pro-preview)`
Imagen de Gemini 3 Pro vista previa `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Gemini Embeddings `(gemini-embeddings-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Imagen 3: Personalización controlada `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Imagen 4 de Ultra Generate `(imagen-4.0-ultra-generate-001)`
Modelos de Veo en Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate vista previa `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Bajos(europe-west4)	Zúrich(europe-west6)	Fráncfort(europe-west3)	Finlandia(europe-north1)	Varsovia(europe-central2)	Milán(europe-west8)	Madrid(europe-southwest1)	París(europe-west9)
Modelos de Gemini
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Gemini 3 Pro vista previa `(gemini-3-pro-preview)`
Imagen de Gemini 3 Pro vista previa `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Gemini Embeddings `(gemini-embeddings-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Imagen 3: Personalización controlada `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Imagen 4 de Ultra Generate `(imagen-4.0-ultra-generate-001)`
Modelos de Veo en Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate vista previa `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Asia-Pacífico

	Bombay(asia-south1)	Singapur(asia-southeast1)	Hong Kong(asia-east2)	Taiwán(asia-east1)	Tokio(asia-northeast1)	Sídney(australia-southeast1)	Seúl(asia-northeast3)
Modelos de Gemini
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Gemini 3 Pro vista previa `(gemini-3-pro-preview)`
Imagen de Gemini 3 Pro vista previa `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Gemini Embeddings `(gemini-embeddings-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Imagen 3: Personalización controlada `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Imagen 4 de Ultra Generate `(imagen-4.0-ultra-generate-001)`
Modelos de Veo en Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate vista previa `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Oriente Medio

	Tel Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modelos de Gemini
Gemini 3 Flash vista previa `(gemini-3-flash-preview)`
Gemini 3 Pro vista previa `(gemini-3-pro-preview)`
Imagen de Gemini 3 Pro vista previa `(gemini-3-pro-image-preview)`
Gemini 2.5 Pro `(gemini-2.5-pro)`
Gemini 2.5 Flash vista previa `(gemini-2.5-flash-preview-09-2025)`
Gemini 2.5 Flash-Lite vista previa `(gemini-2.5-flash-lite-preview-09-2025)`
Imagen de Gemini 2.5 Flash `(gemini-2.5-flash-image)`
Gemini 2.5 Flash `(gemini-2.5-flash)`
Gemini 2.5 Flash-Lite `(gemini-2.5-flash-lite)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live `(gemini-live-2.5-flash-native-audio)`
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa `(gemini-live-2.5-flash-preview-native-audio-09-2025)`
Gemini 2.0 Flash con la API de Gemini Live vista previa `(gemini-2.0-flash-live-preview-04-09)`
Gemini 2.0 Flash `(gemini-2.0-flash)`
Gemini 2.0 Flash-Lite `(gemini-2.0-flash-lite)`
Modelos de embeddings
Gemini Embeddings `(gemini-embeddings-001)`
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 `(imagen-3.0-generate-002)`
Imagen 3 `(imagen-3.0-generate-001)`
Imagen 3 Fast `(imagen-3.0-fast-generate-001)`
Imagen 3: Personalización controlada `(imagen-3.0-capability-001)`
Imagen 4 `(imagen-4.0-generate-001)`
Imagen 4 `(imagen-4.0-fast-generate-001)`
Imagen 4 de Ultra Generate `(imagen-4.0-ultra-generate-001)`
Modelos de Veo en Vertex AI
Veo 2 Generate `(veo-2.0-generate-001)`
Veo 2 Generate vista previa `(veo-2.0-generate-exp)`
Veo 2 Generate vista previa `(veo-2.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-generate-preview)`
Veo 3 Generate vista previa `(veo-3.0-fast-generate-preview)`
Veo 3 Generate `(veo-3.0-generate-001)`
Veo 3 Fast Generate `(veo-3.0-fast-generate-001)`
Veo 3.1 Generate vista previa `(veo-3.1-generate-preview)`
Veo 3.1 Fast Generate vista previa `(veo-3.1-fast-generate-preview)`
Veo 3.1 Generate `(veo-3.1-generate-001)`
Veo 3.1 Fast Generate `(veo-3.1-fast-generate-001)`
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción `(chirp_3)`
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción `(chirp_2)`
Gemini 2.5 Pro TTS `(gemini-2.5-pro-tts)`
TTS de Gemini 2.5 Flash `(gemini-2.5-flash-tts)`
TTS de Gemini 2.5 Flash Lite Preview vista previa `(gemini-2.5-flash-lite-preview-tts)`

Ubicaciones de extremos de modelos de sociosGoogle Cloud

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un extremo global para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto independiente de cuotas del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos de socios de Vertex AI para MaaS.

Los extremos de los modelos de socios para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Global

	Global(global)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Estados Unidos

	Oregón(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina del Sur(us-east1)	N. Virginia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

América

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Bajos(europe-west4)	Zúrich(europe-west6)	Fráncfort(europe-west3)	Finlandia(europe-north1)	Varsovia(europe-central2)	Milán(europe-west8)	Madrid(europe-southwest1)	París(europe-west9)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asia-Pacífico

	Bombay(asia-south1)	Singapur(asia-southeast1)	Hong Kong(asia-east2)	Taiwán(asia-east1)	Tokio(asia-northeast1)	Sídney(australia-southeast1)	Seúl(asia-northeast3)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Oriente Medio

	Tel Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud ubicaciones de extremos de modelos abiertos

Los extremos de modelos abiertos para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Global

	Global(global)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos de MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 grande multilingüe `(multilingual-e5-large-instruct-maas)`

Estados Unidos

	Oregón(us-west1)	Las Vegas(us-west4)	Iowa(us-central1)	Carolina del Sur(us-east1)	N. Virginia(us-east4)	Columbus(us-east5)	Dallas(us-south1)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 grande multilingüe `(multilingual-e5-large-instruct-maas)`

América

	Montreal(northamerica-northeast1)	São Paulo(southamerica-east1)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 grande multilingüe `(multilingual-e5-large-instruct-maas)`

Europa

	Londres(europe-west2)	Bélgica(europe-west1)	Países Bajos(europe-west4)	Zúrich(europe-west6)	Fráncfort(europe-west3)	Finlandia(europe-north1)	Varsovia(europe-central2)	Milán(europe-west8)	Madrid(europe-southwest1)	París(europe-west9)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 grande multilingüe `(multilingual-e5-large-instruct-maas)`

Asia-Pacífico

	Bombay(asia-south1)	Singapur(asia-southeast1)	Hong Kong(asia-east2)	Taiwán(asia-east1)	Tokio(asia-northeast1)	Sídney(australia-southeast1)	Seúl(asia-northeast3)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos de MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 grande multilingüe `(multilingual-e5-large-instruct-maas)`

Oriente Medio

	Tel Aviv(me-west1)	Doha(me-central1)	Dammam(me-central2)
Modelos de DeepSeek
DeepSeek-OCR `(deepseek-ocr-maas)`
DeepSeek-V3.2 `(deepseek-v3.2-maas)`
DeepSeek-V3.1 `(deepseek-v3.1-maas)`
DeepSeek R1 (0528) `(deepseek-r1-0528-maas)`
Modelos de ZAI.org
GLM 4.7 `(glm-4.7-maas)`
GLM 5 `(glm-5-maas)`
Modelos de OpenAI
gpt-oss 120B `(gpt-oss-120b-maas)`
gpt-oss 20B `(gpt-oss-20b-maas)`
Modelos de IA de Moonshot
Kimi K2 Thinking `(kimi-k2-thinking-maas)`
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 `(minimax-m2-maas)`
Modelos de Qwen
Qwen3-Next-80B Thinking `(qwen3-next-80b-a3b-thinking-maas)`
Qwen3-Next-80B Instruct `(qwen3-next-80b-a3b-instruct-maas)`
Qwen3 Coder `(qwen3-coder-480b-a35b-instruct-maas)`
Qwen3 235B `(qwen3-235b-a22b-instruct-2507-maas)`
Modelos e5
Multilingual E5 Small `(multilingual-e5-small-maas)`
E5 grande multilingüe `(multilingual-e5-large-instruct-maas)`

¿Qué sigue?

Obtén más información sobre la residencia de datos de la IA generativa en Vertex AI.
Obtén información sobre las regiones deGoogle Cloud .
Obtén más información sobre los controles de seguridad por función.
Conoce los modelos que proporcionan asistencia para la generación generativa de Vertex AI. Consulta Referencia básica de modelos generativos de IA.
Obtén información sobre las ubicaciones de Vertex AI.

Implementaciones y extremos Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Extremo global

Modelos compatibles

Usa el extremo global

Limitaciones

Haz clic para ver los modelos compatibles con el extremo global cuando se usa la capacidad de procesamiento aprovisionada.

Ubicaciones de los extremos de los modelos de Google

Global

Estados Unidos

América

Europa

Asia-Pacífico

Oriente Medio

Ubicaciones de extremos de modelos de sociosGoogle Cloud

Global

Estados Unidos

América

Europa

Asia-Pacífico

Oriente Medio

Google Cloud ubicaciones de extremos de modelos abiertos

Global

Estados Unidos

América

Europa

Asia-Pacífico

Oriente Medio

¿Qué sigue?

Implementaciones y extremos