Los modelos de Google y de socios, y las funciones de IA generativa en Vertex AI se exponen como extremos regionales específicos y un extremo global. Los extremos globales abarcan todo el mundo y proporcionan mayor disponibilidad y confiabilidad que las regiones individuales.
Extremo global
Seleccionar un extremo global para tus solicitudes puede mejorar la disponibilidad general y reducir los errores de recursos agotados (429). No uses el extremo global si tienes requisitos de procesamiento de AA, ya que no puedes controlar ni saber a qué región se envían tus solicitudes de procesamiento de AA cuando se realiza una solicitud.
Modelos compatibles
El uso del extremo global es compatible con los siguientes modelos de Google en las regiones especificadas. Para obtener detalles sobre qué regiones admiten el extremo global, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de Google.
- Gemini 3 Pro (versión preliminar)
- Gemini 3 Pro Image (versión preliminar)
- Gemini 2.5 Pro
- Gemini 2.5 Flash (versión preliminar)
- Gemini 2.5 Flash-Lite (versión preliminar)
- Gemini 2.5 Flash Image
- Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.0 Flash con generación de imágenes (versión preliminar)
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Para obtener información sobre la disponibilidad global de los extremos para los modelos de socios, consulta la pestaña Global en la tabla de ubicaciones de extremos de modelos de socios.Google Cloud
Usa el extremo global
Para usar el extremo global, excluye la ubicación del nombre del extremo y configura la ubicación del recurso como global. Por ejemplo, la siguiente es una URL de extremo global:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Para el SDK de IA generativa de Google, crea un cliente que use la ubicación global:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
En el caso del SDK de Vertex AI para Python, inicializa el SDK con la ubicación global:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitaciones
Las siguientes capacidades no están disponibles cuando se usa el extremo global:
- Ajuste
- Predicción por lotes para modelos de Anthropic y OpenMaaS
- Corpus de generación mejorada por recuperación (RAG) (se admiten solicitudes de RAG)
El uso del extremo global con la capacidad de procesamiento aprovisionada solo está disponible para los siguientes modelos:
| Modelo | Versión del modelo compatible más reciente |
|---|---|
| Gemini 3 Pro (versión preliminar) | gemini-3-pro-preview |
| Gemini 3 Pro Image (versión preliminar) | gemini-3-pro-image-preview |
| Gemini 2.5 Pro | gemini-2.5-pro |
| Gemini 2.5 Flash (versión preliminar) | gemini-2.5-flash-preview-09-2025 |
| Gemini 2.5 Flash-Lite (versión preliminar) | gemini-2.5-flash-lite-preview-09-2025 |
| Gemini 2.5 Flash Image | gemini-2.5-flash-image |
| Gemini 2.5 Flash | gemini-2.5-flash |
| Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
| Gemini 2.0 Flash | gemini-2.0-flash-001 |
| Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Ubicaciones de los extremos de los modelos de Google
Los extremos de los modelos de Google para la IA generativa en Vertex AI están disponibles en las siguientes regiones.
Estados Unidos
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina del Sur (us-east1) | Virginia del Norte (us-east4) | Oregón (us-west1) | |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||||||
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|||||||
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||||||
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio) |
|||||||
| Imagen de Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||||||
| Incorporaciones de Gemini ( gemini-embedding-001) |
|||||||
| Incorporaciones para texto | |||||||
| Incorporaciones para multimodales | |||||||
| Imagen ( imagegeneration@002) |
|||||||
| Imagen 2 ( imagegeneration@005) |
|||||||
| Imagen 2 ( imagegeneration@006) |
|||||||
| Imagen 3 ( imagen-3.0-generate-001) |
|||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||||||
| Edición y personalización de Imagen 3 ( imagen-3.0-capability-001) |
|||||||
| Imagen 3 ( imagen-3.0-generate-002) |
|||||||
| Imagen 4
( imagen-4.0-generate-001) |
|||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||||||
| Generación experimental con Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|||||||
| Veo 2
( veo-2.0-generate-001) |
|||||||
| Veo 3
( veo-3.0-generate-001) |
|||||||
| Veo 3 Fast
( veo-3.0-fast-generate-001) |
|||||||
| Veo 3 (versión preliminar)
( veo-3.0-generate-preview) |
|||||||
| Veo 3 Fast (versión preliminar)
( veo-3.0-fast-generate-preview) |
|||||||
| Veo 3.1
( veo-3.1-generate-001) |
|||||||
| Veo 3.1 Fast
( veo-3.1-fast-generate-001) |
|||||||
| Veo 3.1 (versión preliminar)
( veo-3.1-generate-preview) |
|||||||
| Veo 3.1 Fast (vista previa)
( veo-3.1-fast-generate-preview) |
|||||||
Chirp 3: Transcripción (chirp_3) |
|||||||
Chirp 2: Transcripción (chirp_2) |
|||||||
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts) |
|||||||
TTS de Gemini 2.5 Flash (gemini-2.5-pro-tts) |
|||||||
| Chirp 3: Voces en HD | |||||||
| Chirp 3: Voz personalizada instantánea |
Canadá
| Montreal (northamerica-northeast1) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Imagen de Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Incorporaciones de Gemini ( gemini-embedding-001) |
|
| Incorporaciones para texto | |
| Incorporaciones para multimodales | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Edición y personalización de Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Generación experimental con Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|
Chirp 3: Transcripción (chirp_3) |
|
Chirp 2: Transcripción (chirp_2) |
|
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts) |
|
TTS de Gemini 2.5 Flash (gemini-2.5-pro-tts) |
|
| Chirp 3: Voces en HD | |
| Chirp 3: Voz personalizada instantánea |
Sudamérica
| São Paulo, Brasil (southamerica-east1) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Imagen de Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Incorporaciones de Gemini ( gemini-embedding-001) |
|
| Incorporaciones para texto | |
| Incorporaciones para multimodales | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Edición y personalización de Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Generación experimental con Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|
Chirp 3: Transcripción (chirp_3) |
|
Chirp 2: Transcripción (chirp_2) |
|
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts) |
|
TTS de Gemini 2.5 Flash (gemini-2.5-pro-tts) |
|
| Chirp 3: Voces en HD | |
| Chirp 3: Voz personalizada instantánea |
Europa
| Países Bajos (europe-west4) | París, Francia (europe-west9) | Londres, Reino Unido (europe-west2) | Fráncfort, Alemania (europe-west3) | Bélgica (europe-west1) | Zúrich, Suiza (europe-west6) | Madrid, España (europe-southwest1) | Milán, Italia (europe-west8) | Finlandia (europe-north1) | Varsovia, Polonia (europe-central2) | |
|---|---|---|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
||||||||||
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
||||||||||
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
||||||||||
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio) |
||||||||||
| Imagen de Gemini 2.5 Flash ( gemini-2.5-flash-image) |
||||||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
||||||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
||||||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
||||||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
||||||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
||||||||||
| Incorporaciones de Gemini ( gemini-embedding-001) |
||||||||||
| Incorporaciones para texto | ||||||||||
| Incorporaciones para multimodales | ||||||||||
| Imagen ( imagegeneration@002) |
||||||||||
| Imagen 2 ( imagegeneration@005) |
||||||||||
| Imagen 2 ( imagegeneration@006) |
||||||||||
| Imagen 3 ( imagen-3.0-generate-001) |
||||||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
||||||||||
| Edición y personalización de Imagen 3 ( imagen-3.0-capability-001) |
||||||||||
| Imagen 3 ( imagen-3.0-generate-002) |
||||||||||
| Imagen 4
( imagen-4.0-generate-001) |
||||||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
||||||||||
| Generación experimental con Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
||||||||||
Chirp 3: Transcripción (chirp_3) |
||||||||||
Chirp 2: Transcripción (chirp_2) |
||||||||||
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts) |
||||||||||
TTS de Gemini 2.5 Flash (gemini-2.5-pro-tts) |
||||||||||
| Chirp 3: Voces en HD | ||||||||||
| Chirp 3: Voz personalizada instantánea |
Asia-Pacífico
| Tokio, Japón (asia-northeast1) | Sídney, Australia (australia-southeast1) | Singapur (asia-southeast1) | Seúl, Corea (asia-northeast3) | Taiwán (asia-east1) | Hong Kong, China (asia-east2) | Bombay, India (asia-south1) | |
|---|---|---|---|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||||||
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|||||||
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||||||
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio) |
|||||||
| Imagen de Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|||||||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||||||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||||||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||||||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||||||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||||||
| Incorporaciones de Gemini ( gemini-embedding-001) |
|||||||
| Incorporaciones para texto | |||||||
| Incorporaciones para multimodales | |||||||
| Imagen ( imagegeneration@002) |
|||||||
| Imagen 2 ( imagegeneration@005) |
|||||||
| Imagen 2 ( imagegeneration@006) |
|||||||
| Imagen 3 ( imagen-3.0-generate-001) |
|||||||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||||||
| Edición y personalización de Imagen 3 ( imagen-3.0-capability-001) |
|||||||
| Imagen 3 ( imagen-3.0-generate-002) |
|||||||
| Imagen 4
( imagen-4.0-generate-001) |
|||||||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||||||
| Generación experimental con Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|||||||
Chirp 3: Transcripción (chirp_3) |
|||||||
Chirp 2: Transcripción (chirp_2) |
|||||||
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts) |
|||||||
TTS de Gemini 2.5 Flash (gemini-2.5-pro-tts) |
|||||||
| Chirp 3: Voces en HD | |||||||
| Chirp 3: Voz personalizada instantánea |
Oriente Medio
| Dammam, Arabia Saudita (me-central2) | Doha, Catar (me-central1) | Tel Aviv, Israel (me-west1) | |
|---|---|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|||
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|||
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|||
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio) |
|||
| Imagen de Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|||
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|||
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|||
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|||
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|||
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|||
| Incorporaciones de Gemini ( gemini-embedding-001) |
|||
| Incorporaciones para texto | |||
| Incorporaciones para multimodales | |||
| Imagen ( imagegeneration@002) |
|||
| Imagen 2 ( imagegeneration@005) |
|||
| Imagen 2 ( imagegeneration@006) |
|||
| Imagen 3 ( imagen-3.0-generate-001) |
|||
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|||
| Edición y personalización de Imagen 3 ( imagen-3.0-capability-001) |
|||
| Imagen 3 ( imagen-3.0-generate-002) |
|||
| Imagen 4
( imagen-4.0-generate-001) |
|||
| Imagen 4
( imagen-4.0-fast-generate-001) |
|||
| Generación experimental con Imagen 4 Ultra
( imagen-4.0-ultra-generate-001) |
|||
Chirp 3: Transcripción (chirp_3) |
|||
Chirp 2: Transcripción (chirp_2) |
|||
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts) |
|||
TTS de Gemini 2.5 Flash (gemini-2.5-pro-tts) |
|||
| Chirp 3: Voces en HD | |||
| Chirp 3: Voz personalizada instantánea |
Global
| Global (global) | |
|---|---|
| Gemini 3 Pro ( gemini-3-pro) |
|
| Gemini 3 Pro Image ( gemini-3-pro-image-preview) |
|
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio-09-2025) |
|
| Gemini 2.5 Flash con audio nativo de la API de Live ( gemini-live-2.5-flash-preview-native-audio) |
|
| Imagen de Gemini 2.5 Flash ( gemini-2.5-flash-image) |
|
| Gemini 2.5 Flash ( gemini-2.5-flash) |
|
| Gemini 2.5 Pro ( gemini-2.5-pro) |
|
| Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite) |
|
| Gemini 2.0 Flash ( gemini-2.0-flash-001) |
|
| Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001) |
|
| Incorporaciones de Gemini ( gemini-embedding-001) |
|
| Incorporaciones para texto | |
| Incorporaciones para multimodales | |
| Imagen ( imagegeneration@002) |
|
| Imagen 2 ( imagegeneration@005) |
|
| Imagen 2 ( imagegeneration@006) |
|
| Imagen 3 ( imagen-3.0-generate-001) |
|
| Imagen 3 Fast ( imagen-3.0-fast-generate-001) |
|
| Edición y personalización de Imagen 3 ( imagen-3.0-capability-001) |
|
| Imagen 3 ( imagen-3.0-generate-002) |
|
| Imagen 4
( imagen-4.0-generate-001) |
|
| Imagen 4
( imagen-4.0-fast-generate-001) |
|
| Imagen 4 Ultra Generate experimental
( imagen-4.0-ultra-generate-001) |
|
Chirp 3: Transcripción (chirp_3) |
|
Chirp 2: Transcripción (chirp_2) |
|
TTS de Gemini 2.5 Flash (gemini-2.5-flash-tts) |
|
TTS de Gemini 2.5 Flash (gemini-2.5-pro-tts) |
|
| Chirp 3: Voces en HD | |
| Chirp 3: Voz personalizada instantánea |
Ubicaciones de extremos de modelos de sociosGoogle Cloud
Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto independiente de cuotas del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos de socios de Vertex AI para MaaS.
Los extremos de los modelos de socios para la IA generativa en Vertex AI están disponibles en las siguientes regiones:
Estados Unidos
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina del Sur (us-east1) | Virginia del Norte (us-east4) | Oregón (us-west1) | |
|---|---|---|---|---|---|---|---|
| Claude Opus 4.5 de Anthropic | |||||||
| Claude Sonnet 4.5 de Anthropic | |||||||
| Claude Opus 4.1 de Anthropic | |||||||
| Claude Haiku 4.5 de Anthropic | |||||||
| Claude Opus 4 de Anthropic | |||||||
| Claude Sonnet 4 de Anthropic | |||||||
| Claude 3.7 Sonnet de Anthropic (obsoleto) | |||||||
| Claude 3.5 Haiku de Anthropic | |||||||
| Claude 3 Haiku de Anthropic | |||||||
| Mistral Medium 3 | |||||||
| OCR de Mistral (25/05) | |||||||
| Mistral Small 3.1 (25/03) | |||||||
| Mistral Large (24.07) | |||||||
| Codestral 2 | |||||||
| Codestral (24.05) |
Europa
| Países Bajos (europe-west4) | Bélgica (europe-west1) | |
|---|---|---|
| Claude Opus 4.5 de Anthropic | ||
| Claude Sonnet 4.5 de Anthropic | ||
| Claude Opus 4.1 de Anthropic | ||
| Claude Haiku 4.5 | ||
| Claude Opus 4 de Anthropic | ||
| Claude Sonnet 4 de Anthropic | ||
| Claude 3.7 Sonnet de Anthropic (obsoleto) | ||
| Claude 3.5 Haiku de Anthropic | ||
| Claude 3 Haiku de Anthropic | ||
| Mistral Medium 3 | ||
| OCR de Mistral (25/05) | ||
| Mistral Small 3.1 (25/03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Asia-Pacífico
| Singapur (asia-southeast1) | Taiwán (asia-east1) | |
|---|---|---|
| Claude Opus 4.5 de Anthropic | ||
| Claude Sonnet 4.5 de Anthropic | ||
| Claude Opus 4.1 de Anthropic | ||
| Claude Haiku 4.5 de Anthropic | ||
| Claude Opus 4 de Anthropic | ||
| Claude Sonnet 4 de Anthropic | ||
| Claude 3.7 Sonnet de Anthropic (obsoleto) | ||
| Claude 3.5 Haiku de Anthropic | ||
| Claude 3 Haiku de Anthropic | ||
| Mistral Medium 3 | ||
| OCR de Mistral (25/05) | ||
| Mistral Small 3.1 (25/03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Global
| Global (global) | ||
|---|---|---|
| Claude Opus 4.5 de Anthropic | ||
| Claude Sonnet 4.5 de Anthropic | ||
| Claude Opus 4.1 de Anthropic | ||
| Claude Haiku 4.5 de Anthropic | ||
| Claude Opus 4 de Anthropic | ||
| Claude Sonnet 4 de Anthropic | ||
| Claude 3.7 Sonnet de Anthropic (obsoleto) | ||
| Claude 3.5 Haiku de Anthropic | ||
| Claude 3 Haiku de Anthropic | ||
| Mistral Medium 3 | ||
| OCR de Mistral (25/05) | ||
| Mistral Small 3.1 (25/03) | ||
| Mistral Large (24.07) | ||
| Codestral 2 | ||
| Codestral (24.05) |
Google Cloud ubicaciones de extremos de modelos abiertos
Google atiende las solicitudes desde la región que especificaste. En el caso de algunos modelos, Google también ofrece un endpoint global para mejorar la disponibilidad general y reducir las tasas de error. El extremo global puede tener un conjunto independiente de cuotas del extremo regional y no admite requisitos de residencia de datos. Para obtener más información, consulta la sección "Extremo regional y global" en Modelos abiertos de Vertex AI para MaaS.
Los extremos de modelos abiertos para la IA generativa en Vertex AI están disponibles en las siguientes regiones:
Estados Unidos
| Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina del Sur (us-east1) | Virginia del Norte (us-east4) | Oregón (us-west1) | |
|---|---|---|---|---|---|---|---|
| DeepSeek R1 (0528) | |||||||
| DeepSeek-OCR | |||||||
| DeepSeek-V3.1 | |||||||
| gpt-oss 120B | |||||||
| gpt-oss 20B | |||||||
| Kimi, K2, Thinking | |||||||
| Llama 3.1 8B (versión preliminar) | |||||||
| Llama 3.1 70B (versión preliminar) | |||||||
| Llama 3.1 405b | |||||||
| Llama 3.2 90B (versión preliminar) | |||||||
| Llama 3.3 70B (versión preliminar) | |||||||
| Llama 4 Maverick 17B-128E (versión preliminar) | |||||||
| Llama 4 Scout 17B-16E (versión preliminar) | |||||||
| MiniMax M2 | |||||||
| Multilingual E5 Large | |||||||
| Multilingual E5 Small | |||||||
| Qwen3 235B | |||||||
| Qwen3 Coder | |||||||
| Qwen3-Next-80B Instruct | |||||||
| Qwen3-Next-80B Thinking |
Europa
| Países Bajos (europe-west4) | Bélgica (europe-west1) | |
|---|---|---|
| DeepSeek R1 (0528) | ||
| DeepSeek-OCR | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi, K2, Thinking | ||
| Llama 3.1 8B (versión preliminar) | ||
| Llama 3.1 70B (versión preliminar) | ||
| Llama 3.1 405b | ||
| Llama 3.2 90B (versión preliminar) | ||
| Llama 3.3 70B (versión preliminar) | ||
| Llama 4 Maverick 17B-128E (versión preliminar) | ||
| Llama 4 Scout 17B-16E (versión preliminar) | ||
| MiniMax M2 | ||
| Multilingual E5 Large | ||
| Multilingual E5 Small | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
Asia-Pacífico
| Singapur (asia-southeast1) | Taiwán (asia-east1) | |
|---|---|---|
| DeepSeek R1 (0528) | ||
| DeepSeek-OCR | ||
| DeepSeek-V3.1 | ||
| gpt-oss 120B | ||
| gpt-oss 20B | ||
| Kimi, K2, Thinking | ||
| Llama 3.1 8B (versión preliminar) | ||
| Llama 3.1 70B (versión preliminar) | ||
| Llama 3.1 405b | ||
| Llama 3.2 90B (versión preliminar) | ||
| Llama 3.3 70B (versión preliminar) | ||
| Llama 4 Maverick 17B-128E (versión preliminar) | ||
| Llama 4 Scout 17B-16E (versión preliminar) | ||
| MiniMax M2 | ||
| Multilingual E5 Large | ||
| Multilingual E5 Small | ||
| Qwen3 235B | ||
| Qwen3 Coder | ||
| Qwen3-Next-80B Instruct | ||
| Qwen3-Next-80B Thinking |
Global
| Global (global) | |
|---|---|
| DeepSeek R1 (0528) | |
| DeepSeek-OCR | |
| DeepSeek-V3.1 | |
| gpt-oss 120B | |
| gpt-oss 20B | |
| Kimi, K2, Thinking | |
| Llama 3.1 8B (versión preliminar) | |
| Llama 3.1 70B (versión preliminar) | |
| Llama 3.1 405b | |
| Llama 3.2 90B (versión preliminar) | |
| Llama 3.3 70B (versión preliminar) | |
| Llama 4 Maverick 17B-128E (versión preliminar) | |
| Llama 4 Scout 17B-16E (versión preliminar) | |
| MiniMax M2 | |
| Multilingual E5 Large | |
| Multilingual E5 Small | |
| Qwen3 235B | |
| Qwen3 Coder | |
| Qwen3-Next-80B Instruct | |
| Qwen3-Next-80B Thinking |
¿Qué sigue?
- Para ver un instructivo en notebook que muestre el extremo global, consulta Introducción al extremo global de Vertex AI.
- Obtén más información sobre la residencia de datos de la IA generativa en Vertex AI.
- Obtén más información sobre las regiones.Google Cloud
- Obtén más información sobre los controles de seguridad por función.
- Conoce los modelos que proporcionan asistencia para la generación generativa de Vertex AI. Consulta Referencia básica de modelos generativos de IA.
- Obtén información sobre las ubicaciones de Vertex AI.