Implementaciones y extremos

Los modelos de Google y de socios, y las funciones de IA generativa en Vertex AI se exponen como extremos regionales específicos y un extremo global. Los extremos globales abarcan todo el mundo y proporcionan mayor disponibilidad y confiabilidad que las regiones individuales.

Ten en cuenta que los extremos del modelo no garantizan la disponibilidad de la región ni el procesamiento de AA en la región. Para obtener información sobre la residencia de datos, consulta Residencia de datos.

Extremo global

Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No uses el extremo global si tienes requisitos de procesamiento de AA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de AA cuando se realiza una solicitud.

Modelos compatibles

El uso del extremo global es compatible con los siguientes modelos de Google en las regiones especificadas. Para obtener detalles sobre qué regiones admiten el extremo global, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de Google.

Para obtener información sobre la disponibilidad global de los extremos para los modelos de socios, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de sociosGoogle Cloud .

Usa el extremo global

Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de extremo global:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

Para el SDK de IA generativa de Google, crea un cliente que use la ubicación global:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

En el caso del SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

Limitaciones

Las siguientes capacidades no están disponibles cuando se usa el extremo global:

  • Ajuste
  • Predicción por lotes
  • Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)

El uso del extremo global con capacidad de procesamiento aprovisionada solo está disponible para los siguientes modelos:

Modelo Versión del modelo compatible más reciente
Gemini 2.5 Flash (versión preliminar) gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite (versión preliminar) gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Ubicaciones de los extremos de los modelos de Google

Los extremos de los modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sur (us-east1) Virginia del Norte (us-east4) Oregón (us-west1)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio)
Imagen de Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (versión preliminar)
(veo-3.0-generate-preview)
Veo 3 Fast (versión preliminar)
(veo-3.0-fast-generate-preview)
Chirp 3: Transcripción (chirp_3)
Chirp 2: Transcripción (chirp_2)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-flash-tts)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-pro-tts)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Canadá

Montreal (northamerica-northeast1)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio)
Imagen de Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcripción (chirp_3)
Chirp 2: Transcripción (chirp_2)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-flash-tts)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-pro-tts)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Sudamérica

São Paulo, Brasil (southamerica-east1)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio)
Imagen de Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcripción (chirp_3)
Chirp 2: Transcripción (chirp_2)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-flash-tts)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-pro-tts)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Europa

Países Bajos (europe-west4) París, Francia (europe-west9) Londres, Reino Unido (europe-west2) Fráncfort, Alemania (europe-west3) Bélgica (europe-west1) Zúrich, Suiza (europe-west6) Madrid, España (europe-southwest1) Milán, Italia (europe-west8) Finlandia (europe-north1) Varsovia, Polonia (europe-central2)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio)
Imagen de Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcripción (chirp_3)
Chirp 2: Transcripción (chirp_2)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-flash-tts)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-pro-tts)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Asia-Pacífico

Tokio, Japón - asia-northeast1 Sídney, Australia (australia-southeast1) Singapur (asia-southeast1) Seúl, Corea (asia-northeast3) Taiwán (asia-east1) Hong Kong, China (asia-east2) Bombay, India (asia-south1)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio)
Imagen de Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
*
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcripción (chirp_3)
Chirp 2: Transcripción (chirp_2)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-flash-tts)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-pro-tts)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Oriente Medio

Dammam, Arabia Saudita (me-central2) Doha, Catar (me-central1) Tel Aviv, Israel (me-west1)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio)
Imagen de Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcripción (chirp_3)
Chirp 2: Transcripción (chirp_2)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-flash-tts)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-pro-tts)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

Global

Global (global)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.5 Flash con audio nativo de la API de Live
(gemini-live-2.5-flash-preview-native-audio)
Imagen de Gemini 2.5 Flash
(gemini-2.5-flash-image)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
Incorporaciones para texto
Incorporaciones para multimodales
Imagen para subtítulos y VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Edición y personalización de Imagen 3
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate experimental
(imagen-4.0-ultra-generate-001)
Chirp 3: Transcripción (chirp_3)
Chirp 2: Transcripción (chirp_2)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-flash-tts)
Texto a voz de Gemini 2.5 Flash (gemini-2.5-pro-tts)
Chirp 3: Voces en HD
Chirp 3: Voz personalizada instantánea

* La región solo está disponible cuando se usa el rendimiento aprovisionado de una sola zona o la predicción por lotes, y el ajuste supervisado no es compatible con esta región.

Ubicaciones de extremos de modelos de socios deGoogle Cloud

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto independiente de cuotas del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos de socios de Vertex AI para MaaS.

Los extremos de los modelos de socios para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sur (us-east1) Virginia del Norte (us-east4) Oregón (us-west1)
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

Países Bajos (europe-west4) Bélgica (europe-west1)
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Asia-Pacífico

Singapur (asia-southeast1) Taiwán (asia-east1)
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Global

Global (global)
Claude Sonnet 4.5 de Anthropic
Claude Opus 4.1 de Anthropic
Claude Haiku 4.5 de Anthropic
Claude Opus 4 de Anthropic
Claude Sonnet 4 de Anthropic
Claude 3.7 Sonnet de Anthropic
Claude 3.5 Haiku de Anthropic
Claude 3 Haiku de Anthropic
Mistral Medium 3
OCR de Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud ubicaciones de extremos de modelos abiertos

Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto independiente de cuotas del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos abiertos de Vertex AI para MaaS.

Los extremos de modelos abiertos para la IA generativa en Vertex AI están disponibles en las siguientes regiones:

Estados Unidos

Columbus, Ohio (us-east5) Dallas, Texas (us-south1) Iowa (us-central1) Las Vegas, Nevada (us-west4) Moncks Corner, Carolina del Sur (us-east1) Virginia del Norte (us-east4) Oregón (us-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Multilingual E5 Small
Multilingual E5 Large

Europa

Países Bajos (europe-west4) Bélgica (europe-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)
Multilingual E5 Small
Multilingual E5 Large

Asia-Pacífico

Singapur (asia-southeast1) Taiwán (asia-east1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)

Global

Global (global)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (versión preliminar)
Llama 4 Scout 17B-16E (versión preliminar)
Llama 3.3 70B (versión preliminar)
Llama 3.2 90B (versión preliminar)
Llama 3.1 405b
Llama 3.1 70B (versión preliminar)
Llama 3.1 8B (versión preliminar)

¿Qué sigue?