Implementaciones y extremos

Los modelos de Google y de socios, y las funciones de IA generativa en Vertex AI se exponen como extremos regionales específicos y un extremo global. Los extremos globales abarcan todo el mundo y proporcionan mayor disponibilidad y confiabilidad que las regiones individuales.

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No uses el extremo global si tienes requisitos de procesamiento de AA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de AA cuando se realiza una solicitud.

Modelos compatibles

El uso del extremo global es compatible con los siguientes modelos de Google en las regiones especificadas. Para obtener detalles sobre qué regiones admiten el extremo global, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de Google.

Para obtener información sobre la disponibilidad global de los extremos para los modelos de socios, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de sociosGoogle Cloud .

Usa el extremo global

Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de extremo global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para el SDK de IA generativa de Google, crea un cliente que use la ubicación global:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

En el caso del SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitaciones

Las siguientes capacidades no están disponibles cuando se usa el extremo global:

  • Ajuste
  • Predicción por lotes para modelos de Anthropic y OpenMaaS
  • Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del extremo global con la capacidad de procesamiento aprovisionada solo está disponible para los siguientes modelos:

Haz clic para ver los modelos compatibles con el extremo global cuando se usa la capacidad de procesamiento aprovisionada.

Modelo Versión del modelo compatible más reciente
Gemini 3 Flash vista previa gemini-3-flash-preview
Gemini 3 Pro versión preliminar gemini-3-pro-preview
Imagen de Gemini 3 Pro vista previa gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash vista previa gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite vista previa gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Ubicaciones de los extremos de los modelos de Google

Los modelos de Google en Vertex AI están disponibles para los siguientes extremos:

Global

Global(global)
Modelos de Gemini
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Gemini 3 Pro vista previa (gemini-3-pro-preview)
Imagen de Gemini 3 Pro vista previa (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelos de embeddings
Gemini Embeddings (gemini-embeddings-001)
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3: Personalización controlada (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 de Ultra Generate (imagen-4.0-ultra-generate-001)
Modelos de Veo en Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate vista previa (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Estados Unidos

Oregón(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sur(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos de Gemini
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Gemini 3 Pro vista previa (gemini-3-pro-preview)
Imagen de Gemini 3 Pro vista previa (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelos de embeddings
Gemini Embeddings (gemini-embeddings-001)
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3: Personalización controlada (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 de Ultra Generate (imagen-4.0-ultra-generate-001)
Modelos de Veo en Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate vista previa (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

América

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos de Gemini
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Gemini 3 Pro vista previa (gemini-3-pro-preview)
Imagen de Gemini 3 Pro vista previa (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelos de embeddings
Gemini Embeddings (gemini-embeddings-001)
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3: Personalización controlada (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 de Ultra Generate (imagen-4.0-ultra-generate-001)
Modelos de Veo en Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate vista previa (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Bajos(europe-west4) Zúrich(europe-west6) Fráncfort(europe-west3) Finlandia(europe-north1) Varsovia(europe-central2) Milán(europe-west8) Madrid(europe-southwest1) París(europe-west9)
Modelos de Gemini
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Gemini 3 Pro vista previa (gemini-3-pro-preview)
Imagen de Gemini 3 Pro vista previa (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelos de embeddings
Gemini Embeddings (gemini-embeddings-001)
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3: Personalización controlada (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 de Ultra Generate (imagen-4.0-ultra-generate-001)
Modelos de Veo en Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate vista previa (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Asia-Pacífico

Bombay(asia-south1) Singapur(asia-southeast1) Hong Kong(asia-east2) Taiwán(asia-east1) Tokio(asia-northeast1) Sídney(australia-southeast1) Seúl(asia-northeast3)
Modelos de Gemini
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Gemini 3 Pro vista previa (gemini-3-pro-preview)
Imagen de Gemini 3 Pro vista previa (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelos de embeddings
Gemini Embeddings (gemini-embeddings-001)
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3: Personalización controlada (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 de Ultra Generate (imagen-4.0-ultra-generate-001)
Modelos de Veo en Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate vista previa (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Oriente Medio

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelos de Gemini
Gemini 3 Flash vista previa (gemini-3-flash-preview)
Gemini 3 Pro vista previa (gemini-3-pro-preview)
Imagen de Gemini 3 Pro vista previa (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash vista previa (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite vista previa (gemini-2.5-flash-lite-preview-09-2025)
Imagen de Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash con audio nativo de la API de Gemini Live vista previa (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash con la API de Gemini Live vista previa (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
Modelos de embeddings
Gemini Embeddings (gemini-embeddings-001)
Incorporaciones para texto
Incorporaciones para multimodales
Modelos de Imagen en Vertex AI
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3: Personalización controlada (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 de Ultra Generate (imagen-4.0-ultra-generate-001)
Modelos de Veo en Vertex AI
Veo 2 Generate (veo-2.0-generate-001)
Veo 2 Generate vista previa (veo-2.0-generate-exp)
Veo 2 Generate vista previa (veo-2.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-generate-preview)
Veo 3 Generate vista previa (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate vista previa (veo-3.1-generate-preview)
Veo 3.1 Fast Generate vista previa (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Modelos de Speech-to-Text y Text-to-Speech
Chirp 3: Transcripción (chirp_3)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea
Chirp 2: Transcripción (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts)
TTS de Gemini 2.5 Flash Lite Preview vista previa (gemini-2.5-flash-lite-preview-tts)

Ubicaciones de extremos de modelos de sociosGoogle Cloud

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un extremo global para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto independiente de cuotas del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos de socios de Vertex AI para MaaS.

Los extremos de los modelos de socios para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Global

Global(global)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Estados Unidos

Oregón(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sur(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

América

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Bajos(europe-west4) Zúrich(europe-west6) Fráncfort(europe-west3) Finlandia(europe-north1) Varsovia(europe-central2) Milán(europe-west8) Madrid(europe-southwest1) París(europe-west9)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asia-Pacífico

Bombay(asia-south1) Singapur(asia-southeast1) Hong Kong(asia-east2) Taiwán(asia-east1) Tokio(asia-northeast1) Sídney(australia-southeast1) Seúl(asia-northeast3)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Oriente Medio

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelos de Anthropic
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Modelos de Mistral
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud ubicaciones de extremos de modelos abiertos

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un extremo global para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto independiente de cuotas del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos abiertos de Vertex AI para MaaS.

Los extremos de modelos abiertos para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Global

Global(global)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos de MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 grande multilingüe (multilingual-e5-large-instruct-maas)

Estados Unidos

Oregón(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina del Sur(us-east1) N. Virginia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 grande multilingüe (multilingual-e5-large-instruct-maas)

América

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 grande multilingüe (multilingual-e5-large-instruct-maas)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Bajos(europe-west4) Zúrich(europe-west6) Fráncfort(europe-west3) Finlandia(europe-north1) Varsovia(europe-central2) Milán(europe-west8) Madrid(europe-southwest1) París(europe-west9)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 grande multilingüe (multilingual-e5-large-instruct-maas)

Asia-Pacífico

Bombay(asia-south1) Singapur(asia-southeast1) Hong Kong(asia-east2) Taiwán(asia-east1) Tokio(asia-northeast1) Sídney(australia-southeast1) Seúl(asia-northeast3)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos de MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 grande multilingüe (multilingual-e5-large-instruct-maas)

Oriente Medio

Tel Aviv(me-west1) Doha(me-central1) Dammam(me-central2)
Modelos de DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos de ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos de OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos de IA de Moonshot
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos de Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos de Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 grande multilingüe (multilingual-e5-large-instruct-maas)

¿Qué sigue?