Despliegues y endpoints

Los modelos de Google y de partners, así como las funciones de IA generativa de Vertex AI, se exponen como endpoints regionales específicos y un endpoint global. Los endpoints globales cubren todo el mundo y ofrecen una disponibilidad y una fiabilidad mayores que las regiones únicas.

Ten en cuenta que los endpoints de los modelos no garantizan la disponibilidad de la región ni el procesamiento de aprendizaje automático en la región. Para obtener información sobre la residencia de datos, consulta el artículo Residencia de datos.

Endpoint global

Si seleccionas un endpoint global para tus solicitudes, puedes mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No utilices el endpoint global si tienes requisitos de procesamiento de aprendizaje automático, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de aprendizaje automático cuando se hace una solicitud.

Modelos admitidos

El uso del endpoint global está disponible para los siguientes modelos de Google en las regiones especificadas. Para obtener información sobre las regiones que admiten el endpoint global, consulta la pestaña Global de la tabla de ubicaciones de endpoints de modelos de Google.

Para obtener información sobre la disponibilidad de los endpoints globales de los modelos de partners, consulta la pestaña Global de la Google Cloud tabla de ubicaciones de los endpoints de los modelos de partners.

Usar el endpoint global

Para usar el endpoint global, excluye la ubicación del nombre del endpoint y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de endpoint global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

En el caso del SDK de Gen AI de Google, crea un cliente que use la ubicación global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

En el SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitaciones

Las siguientes funciones no están disponibles cuando se usa el endpoint global:

  • Ajuste
  • Predicción por lotes
  • Corpus de generación aumentada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del endpoint global con Provisioned Throughput solo está disponible para los siguientes modelos:

Modelo Versión de modelo más reciente admitida
Gemini 2.5 Flash (versión preliminar) gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite (versión preliminar) gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Ubicaciones de los endpoints de los modelos de Google

Los endpoints de modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.

Estados Unidos

Columbus (Ohio) (us-east5) Dallas, Texas (us-south1) Iowa (us‑central1) Las Vegas, Nevada (us-west4) Moncks Corner (Carolina del Sur) (us-east1) Norte de Virginia (us‑east4) Oregón (us-west1)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones multimodales
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (versión preliminar)
(veo-3.0-generate-preview)
Veo 3 Fast (versión preliminar)
(veo-3.0-fast-generate-preview)
Chirp 3: transcripción (chirp_3)
Chirp 2: transcripción (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Canadá

Montreal (northamerica-northeast1)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones multimodales
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: transcripción (chirp_3)
Chirp 2: transcripción (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Sudamérica

São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones multimodales
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: transcripción (chirp_3)
Chirp 2: transcripción (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Europa

Países Bajos (europe-west4) París, Francia (europe-west9) Londres (Reino Unido) (europe-west2) Fráncfort (Alemania) (europe-west3) Bélgica (europe‑west1) Zúrich (Suiza) (europe-west6) Madrid, España (europe-southwest1) Milán, Italia (europe-west8) Finlandia (europe-north1) Varsovia, Polonia (europe-central2)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones multimodales
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: transcripción (chirp_3)
Chirp 2: transcripción (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Asia-Pacífico

Tokio, Japón (asia-northeast1) Sídney (Australia) (australia-southeast1) Singapur (asia-southeast1) Seúl (Corea del Sur) (asia-northeast3) Taiwán (asia-east1) Hong Kong (China) (asia-east2) Bombay (India) (asia-south1)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
*
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones multimodales
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: transcripción (chirp_3)
Chirp 2: transcripción (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Oriente Próximo

Dammam (Arabia Saudí) (me-central2) Doha, Qatar (me-central1) Tel Aviv (Israel) (me-west1)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones multimodales
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: transcripción (chirp_3)
Chirp 2: transcripción (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

Global

Global (global)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API Live
(gemini-live-2.5-flash-preview-native-audio)
Gemini 2.5 Flash Image
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Embeddings de texto
Incrustaciones multimodales
Imagen para subtitulado y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: transcripción (chirp_3)
Chirp 2: transcripción (chirp_2)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts)
Chirp 3: voces en HD
Chirp 3: Voz personalizada instantánea

* La región solo está disponible cuando se usa Capacidad de procesamiento reservada de una sola zona o la predicción por lotes, y no se admite el ajuste fino supervisado en esta región.

Google Cloud ubicaciones de endpoints de modelos de partners

Google sirve las solicitudes de la región que hayas especificado. En algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto de cuotas independiente del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Endpoint regional y global" en Modelos de partners de Vertex AI para MaaS.

Los endpoints de modelos de partners de la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

Columbus (Ohio) (us-east5) Dallas, Texas (us-south1) Iowa (us‑central1) Las Vegas, Nevada (us-west4) Moncks Corner (Carolina del Sur) (us-east1) Norte de Virginia (us‑east4) Oregón (us-west1)
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

Países Bajos (europe-west4) Bélgica (europe‑west1)
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asia-Pacífico

Singapur (asia-southeast1) Taiwán (asia-east1)
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

Global (global)
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud ubicaciones de endpoints de modelos abiertos

Google sirve las solicitudes de la región que hayas especificado. En algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto de cuotas independiente del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Endpoint regional y global" del artículo Modelos abiertos de Vertex AI para MaaS.

Los endpoints de modelos abiertos de la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

Columbus (Ohio) (us-east5) Dallas, Texas (us-south1) Iowa (us‑central1) Las Vegas, Nevada (us-west4) Moncks Corner (Carolina del Sur) (us-east1) Norte de Virginia (us‑east4) Oregón (us-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405B
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Multilingual E5 Small
Multilingual E5 Large

Europa

Países Bajos (europe-west4) Bélgica (europe‑west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405B
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Multilingual E5 Small
Multilingual E5 Large

Asia-Pacífico

Singapur (asia-southeast1) Taiwán (asia-east1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405B
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)

Global

Global (global)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405B
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)

Siguientes pasos