Los modelos de Google y de partners, así como las funciones de IA generativa de Vertex AI, se exponen como endpoints regionales específicos y un endpoint global. Los endpoints globales cubren todo el mundo y ofrecen una disponibilidad y una fiabilidad mayores que las regiones únicas.
Ten en cuenta que los endpoints de los modelos no garantizan la disponibilidad de la región ni el procesamiento de aprendizaje automático en la región. Para obtener información sobre la residencia de datos, consulta el artículo Residencia de datos.
Endpoint global
Si seleccionas un endpoint global para tus solicitudes, puedes mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No utilices el endpoint global si tienes requisitos de procesamiento de aprendizaje automático, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de aprendizaje automático cuando se hace una solicitud.
Modelos admitidos
El uso del endpoint global está disponible para los siguientes modelos de Google en las regiones especificadas. Para obtener información sobre las regiones que admiten el endpoint global, consulta la pestaña Global de la tabla de ubicaciones de endpoints de modelos de Google.
- Gemini 2.5 Flash (versión preliminar)
- Gemini 2.5 Flash-Lite (versión preliminar)
- Gemini 2.5 Flash Image
- Gemini 2.5 Flash-Lite
- Gemini 2.0 Flash con generación de imágenes (Vista previa)
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Para obtener información sobre la disponibilidad de los endpoints globales de los modelos de partners, consulta la pestaña Global de la Google Cloud tabla de ubicaciones de los endpoints de los modelos de partners.
Usar el endpoint global
Para usar el endpoint global, excluye la ubicación del nombre del endpoint y configura la ubicación del recurso como global
. Por ejemplo, la siguiente es una URL de endpoint global:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
En el caso del SDK de Gen AI de Google, crea un cliente que use la ubicación global
:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
En el SDK de Vertex AI para Python, inicializa el SDK con la ubicación global
:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitaciones
Las siguientes funciones no están disponibles cuando se usa el endpoint global:
- Ajuste
- Predicción por lotes
- Corpus de generación aumentada por recuperación (RAG) (se admiten solicitudes de RAG)
El uso del endpoint global con Provisioned Throughput solo está disponible para los siguientes modelos:
Modelo | Versión de modelo más reciente admitida |
---|---|
Gemini 2.5 Flash (versión preliminar) | gemini-2.5-flash-preview-09-2025 |
Gemini 2.5 Flash-Lite (versión preliminar) | gemini-2.5-flash-lite-preview-09-2025 |
Gemini 2.5 Flash Image | gemini-2.5-flash-image |
Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Ubicaciones de los endpoints de los modelos de Google
Los endpoints de modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.
Estados Unidos
Columbus (Ohio) (us-east5) | Dallas, Texas (us-south1) | Iowa (us‑central1) | Las Vegas, Nevada (us-west4) | Moncks Corner (Carolina del Sur) (us-east1) | Norte de Virginia (us‑east4) | Oregón (us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
|||||||
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio ) |
|||||||
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
|||||||
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Embeddings de texto | |||||||
Incrustaciones multimodales | |||||||
Imagen para subtitulado y VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
|||||||
Veo 2
( veo-2.0-generate-001 ) |
|||||||
Veo 3
( veo-3.0-generate-001 ) |
|||||||
Veo 3 Fast
( veo-3.0-fast-generate-001 ) |
|||||||
Veo 3 (versión preliminar)
( veo-3.0-generate-preview ) |
|||||||
Veo 3 Fast (versión preliminar)
( veo-3.0-fast-generate-preview ) |
|||||||
Chirp 3: transcripción (chirp_3 ) |
|||||||
Chirp 2: transcripción (chirp_2 ) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
|||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
|||||||
Chirp 3: voces en HD | |||||||
Chirp 3: Voz personalizada instantánea |
Canadá
Montreal (northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio ) |
|
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings de texto | |
Incrustaciones multimodales | |
Imagen para subtitulado y VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
|
Chirp 3: transcripción (chirp_3 ) |
|
Chirp 2: transcripción (chirp_2 ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
|
Chirp 3: voces en HD | |
Chirp 3: Voz personalizada instantánea |
Sudamérica
São Paulo, Brasil (southamerica-east1) | |
---|---|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio ) |
|
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings de texto | |
Incrustaciones multimodales | |
Imagen para subtitulado y VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
|
Chirp 3: transcripción (chirp_3 ) |
|
Chirp 2: transcripción (chirp_2 ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
|
Chirp 3: voces en HD | |
Chirp 3: Voz personalizada instantánea |
Europa
Países Bajos (europe-west4) | París, Francia (europe-west9) | Londres (Reino Unido) (europe-west2) | Fráncfort (Alemania) (europe-west3) | Bélgica (europe‑west1) | Zúrich (Suiza) (europe-west6) | Madrid, España (europe-southwest1) | Milán, Italia (europe-west8) | Finlandia (europe-north1) | Varsovia, Polonia (europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
||||||||||
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio ) |
||||||||||
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
||||||||||
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | |||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings de texto | ||||||||||
Incrustaciones multimodales | ||||||||||
Imagen para subtitulado y VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3imagen-3.0-generate-002 |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
||||||||||
Chirp 3: transcripción (chirp_3 ) |
||||||||||
Chirp 2: transcripción (chirp_2 ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
||||||||||
Chirp 3: voces en HD | ||||||||||
Chirp 3: Voz personalizada instantánea |
Asia-Pacífico
Tokio, Japón (asia-northeast1) | Sídney (Australia) (australia-southeast1) | Singapur (asia-southeast1) | Seúl (Corea del Sur) (asia-northeast3) | Taiwán (asia-east1) | Hong Kong (China) (asia-east2) | Bombay (India) (asia-south1) | ||||
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
||||||||||
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio ) |
||||||||||
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
||||||||||
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | * | * | |||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
* | |||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings de texto | ||||||||||
Incrustaciones multimodales | ||||||||||
Imagen para subtitulado y VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
||||||||||
Chirp 3: transcripción (chirp_3 ) |
||||||||||
Chirp 2: transcripción (chirp_2 ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
||||||||||
Chirp 3: voces en HD | ||||||||||
Chirp 3: Voz personalizada instantánea |
Oriente Próximo
Dammam (Arabia Saudí) (me-central2) | Doha, Qatar (me-central1) | Tel Aviv (Israel) (me-west1) | ||||||||
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
||||||||||
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio ) |
||||||||||
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
||||||||||
Gemini 2.5 Flash ( gemini-2.5-flash ) |
||||||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings de texto | ||||||||||
Incrustaciones multimodales | ||||||||||
Imagen para subtitulado y VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
||||||||||
Chirp 3: transcripción (chirp_3 ) |
||||||||||
Chirp 2: transcripción (chirp_2 ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
||||||||||
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
||||||||||
Chirp 3: voces en HD | ||||||||||
Chirp 3: Voz personalizada instantánea |
Global
Global (global) | |
---|---|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio-09-2025 ) |
|
Gemini 2.5 Flash con audio nativo de la API Live ( gemini-live-2.5-flash-preview-native-audio ) |
|
Gemini 2.5 Flash Image ( gemini-2.5-flash-image ) |
|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings de texto | |
Incrustaciones multimodales | |
Imagen para subtitulado y VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edición y personalización de Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001 ) |
|
Chirp 3: transcripción (chirp_3 ) |
|
Chirp 2: transcripción (chirp_2 ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts ) |
|
Gemini 2.5 Flash TTS (gemini-2.5-pro-tts ) |
|
Chirp 3: voces en HD | |
Chirp 3: Voz personalizada instantánea |
* La región solo está disponible cuando se usa Capacidad de procesamiento reservada de una sola zona o la predicción por lotes, y no se admite el ajuste fino supervisado en esta región.
Google Cloud ubicaciones de endpoints de modelos de partners
Google sirve las solicitudes de la región que hayas especificado. En algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto de cuotas independiente del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Endpoint regional y global" en Modelos de partners de Vertex AI para MaaS.
Los endpoints de modelos de partners de la IA generativa en Vertex AI están disponibles en las siguientes regiones:
Estados Unidos
Columbus (Ohio) (us-east5) | Dallas, Texas (us-south1) | Iowa (us‑central1) | Las Vegas, Nevada (us-west4) | Moncks Corner (Carolina del Sur) (us-east1) | Norte de Virginia (us‑east4) | Oregón (us-west1) | |
---|---|---|---|---|---|---|---|
Claude Sonnet 4.5 de Anthropic | |||||||
Claude Opus 4.1 de Anthropic | |||||||
Claude Haiku 4.5 de Anthropic | |||||||
Claude Opus 4 de Anthropic | |||||||
Claude Sonnet 4 de Anthropic | |||||||
Claude 3.7 Sonnet de Anthropic | |||||||
Claude 3.5 Haiku de Anthropic | |||||||
Claude 3 Haiku de Anthropic | |||||||
Mistral Medium 3 | |||||||
Mistral OCR (25.05) | |||||||
Mistral Small 3.1 (25.03) | |||||||
Mistral Large (24.07) | |||||||
Codestral 2 | |||||||
Codestral (24.05) |
Europa
Países Bajos (europe-west4) | Bélgica (europe‑west1) | |
---|---|---|
Claude Sonnet 4.5 de Anthropic | ||
Claude Opus 4.1 de Anthropic | ||
Claude Haiku 4.5 | ||
Claude Opus 4 de Anthropic | ||
Claude Sonnet 4 de Anthropic | ||
Claude 3.7 Sonnet de Anthropic | ||
Claude 3.5 Haiku de Anthropic | ||
Claude 3 Haiku de Anthropic | ||
Mistral Medium 3 | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25.03) | ||
Mistral Large (24.07) | ||
Codestral 2 | ||
Codestral (24.05) |
Asia-Pacífico
Singapur (asia-southeast1) | Taiwán (asia-east1) | |
---|---|---|
Claude Sonnet 4.5 de Anthropic | ||
Claude Opus 4.1 de Anthropic | ||
Claude Haiku 4.5 de Anthropic | ||
Claude Opus 4 de Anthropic | ||
Claude Sonnet 4 de Anthropic | ||
Claude 3.7 Sonnet de Anthropic | ||
Claude 3.5 Haiku de Anthropic | ||
Claude 3 Haiku de Anthropic | ||
Mistral Medium 3 | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25.03) | ||
Mistral Large (24.07) | ||
Codestral 2 | ||
Codestral (24.05) |
Global
Global (global) | ||
---|---|---|
Claude Sonnet 4.5 de Anthropic | ||
Claude Opus 4.1 de Anthropic | ||
Claude Haiku 4.5 de Anthropic | ||
Claude Opus 4 de Anthropic | ||
Claude Sonnet 4 de Anthropic | ||
Claude 3.7 Sonnet de Anthropic | ||
Claude 3.5 Haiku de Anthropic | ||
Claude 3 Haiku de Anthropic | ||
Mistral Medium 3 | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25.03) | ||
Mistral Large (24.07) | ||
Codestral 2 | ||
Codestral (24.05) |
Google Cloud ubicaciones de endpoints de modelos abiertos
Google sirve las solicitudes de la región que hayas especificado. En algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El endpoint global puede tener un conjunto de cuotas independiente del endpoint regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Endpoint regional y global" del artículo Modelos abiertos de Vertex AI para MaaS.
Los endpoints de modelos abiertos de la IA generativa en Vertex AI están disponibles en las siguientes regiones:
Estados Unidos
Columbus (Ohio) (us-east5) | Dallas, Texas (us-south1) | Iowa (us‑central1) | Las Vegas, Nevada (us-west4) | Moncks Corner (Carolina del Sur) (us-east1) | Norte de Virginia (us‑east4) | Oregón (us-west1) | |
---|---|---|---|---|---|---|---|
DeepSeek R1 (0528) | |||||||
Llama 4 Maverick 17B-128E (versión preliminar) | |||||||
Llama 4 Scout 17B-16E (versión preliminar) | |||||||
Llama 3.3 70B (versión preliminar) | |||||||
Llama 3.2 90B (versión preliminar) | |||||||
Llama 3.1 405B | |||||||
Llama 3.1 70B (versión preliminar) | |||||||
Llama 3.1 8B (versión preliminar) | |||||||
Multilingual E5 Small | |||||||
Multilingual E5 Large |
Europa
Países Bajos (europe-west4) | Bélgica (europe‑west1) | ||
---|---|---|---|
DeepSeek R1 (0528) | |||
Llama 4 Maverick 17B-128E (versión preliminar) | |||
Llama 4 Scout 17B-16E (versión preliminar) | |||
Llama 3.3 70B (versión preliminar) | |||
Llama 3.2 90B (versión preliminar) | |||
Llama 3.1 405B | |||
Llama 3.1 70B (versión preliminar) | |||
Llama 3.1 8B (versión preliminar) | |||
Multilingual E5 Small | |||
Multilingual E5 Large |
Asia-Pacífico
Singapur (asia-southeast1) | Taiwán (asia-east1) | |
---|---|---|
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E (versión preliminar) | ||
Llama 4 Scout 17B-16E (versión preliminar) | ||
Llama 3.3 70B (versión preliminar) | ||
Llama 3.2 90B (versión preliminar) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (versión preliminar) | ||
Llama 3.1 8B (versión preliminar) |
Global
Global (global) | |
---|---|
DeepSeek R1 (0528) | |
Llama 4 Maverick 17B-128E (versión preliminar) | |
Llama 4 Scout 17B-16E (versión preliminar) | |
Llama 3.3 70B (versión preliminar) | |
Llama 3.2 90B (versión preliminar) | |
Llama 3.1 405B | |
Llama 3.1 70B (versión preliminar) | |
Llama 3.1 8B (versión preliminar) |
Siguientes pasos
- Para ver un tutorial en un cuaderno que muestra el endpoint global, consulta Introducción al endpoint global de Vertex AI.
- Consulta más información sobre la residencia de datos de la IA generativa en Vertex AI.
- Consulta información sobre las Google Cloud regiones.
- Consulta más información sobre los controles de seguridad por función.
- Consulta información sobre los modelos que ofrecen compatibilidad con la IA generativa en Vertex AI. Consulta la referencia del modelo fundamental de IA generativa.
- Consulta información sobre las ubicaciones de Vertex AI.