Implantações e endpoints

Os modelos do Google e dos parceiros e os recursos de IA generativa na Gemini Enterprise Agent Platform são expostos como endpoints regionais específicos e um endpoint global. Os endpoints globais abrangem o mundo todo e oferecem maior disponibilidade e confiabilidade do que as regiões únicas.

Especificar um endpoint

Para endpoints regionais padrão (como us-central) e o endpoint global:

Python

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='GOOGLE_CLOUD_PROJECT', location='GOOGLE_CLOUD_LOCATION')

Python

client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION"
MODEL_ID="MODEL_ID"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://${GOOGLE_CLOUD_LOCATION}$-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words."
      }
    }
  }'

Endpoints multirregionais

Com os endpoints multirregionais, você garante que o tratamento de machine learning dos dados do cliente pelo serviço permaneça dentro de um limite jurisdicional específico, como os Estados Unidos ou a União Europeia.

A tabela a seguir lista os nomes de host para endpoints multirregionais:

Multirregional Local Nome do host
Estados Unidos us https://aiplatform.us.rep.googleapis.com
União Europeia eu https://aiplatform.eu.rep.googleapis.com

Python

import vertexai
from google.adk.agents import Agent

# Set the multi-region location on the client
client = vertexai.Client(
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

# The agent will use this configuration
agent = Agent(
    model="gemini-2.5-flash",
    name='my_agent'
)

Python

from google import genai

# location must be set to 'us' or 'eu' for multi-region routing
client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
MODEL_ID="MODEL_ID"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION" # Must be 'us' or 'eu'
# Explicitly use the .rep. hostname for multi-region endpoints
API_ENDPOINT="https://aiplatform.${GOOGLE_CLOUD_LOCATION}.rep.googleapis.com"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "${API_ENDPOINT}/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words"
      }
    }
  }'

Endpoint global

Selecionar um endpoint global para suas solicitações pode melhorar a disponibilidade geral e reduzir os erros de recurso esgotado (429). Não use o endpoint global se você tiver requisitos de processamento de ML, porque não é possível controlar ou saber para qual região suas solicitações de processamento de ML são enviadas quando uma solicitação é feita.

Modelos compatíveis

O uso do endpoint global é compatível com os seguintes modelos do Google nas regiões especificadas. Para saber quais modelos são compatíveis com o endpoint global, consulte a guia Global na tabela de locais de endpoints de modelos do Google.

Para informações sobre a disponibilidade global de endpoints para modelos de parceiros, consulte a guia Global na tabela de locais de endpoints de modelos de parceiros doGoogle Cloud .

Limitações

Os seguintes recursos não estão disponíveis ao usar o endpoint global:

  • Ajuste
  • Previsão em lote para modelos da Anthropic e do OpenMaaS
  • Corpus de geração aumentada por recuperação (RAG) (as solicitações de RAG são aceitas)

O uso do endpoint global com capacidade de processamento provisionada está disponível apenas para os seguintes modelos:

Clique para ver os modelos compatíveis com o endpoint global ao usar a capacidade de processamento provisionada

Modelo Versão mais recente do modelo com suporte
Gemini 3.5 Flash gemini-3.5-flash
Gemini 3.1 Flash-Lite gemini-3.1-flash-lite
Criação de imagens do Gemini 3.1 Flash pré-lançamento gemini-3.1-flash-image-preview
Gemini 3.1 Pro pré-lançamento gemini-3.1-pro-preview
Gemini 3 Flash pré-lançamento gemini-3-flash-preview
Gemini 3 Pro Image pré-lançamento gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash pré-lançamento gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite pré-lançamento gemini-2.5-flash-lite-preview-09-2025
Criação de Imagens do Gemini 2.5 Flash gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite

Locais de endpoints de modelos do Google

Os modelos do Google na plataforma de agentes do Gemini Enterprise estão disponíveis para os seguintes endpoints:

Global

Global(global)
Modelos do Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Criação de imagens do Gemini 3.1 Flash pré-lançamento (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro pré-lançamento (gemini-3.1-pro-preview)
Gemini 3 Flash pré-lançamento (gemini-3-flash-preview)
Gemini 3 Pro Image pré-lançamento (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pré-lançamento (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pré-lançamento (gemini-2.5-flash-lite-preview-09-2025)
Criação de Imagens do Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash com a API Gemini Live pré-lançamento (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Incorporação do Gemini (gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Veo nos modelos da Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Geração do Veo 2 prévia (veo-2.0-generate-exp)
Geração do Veo 2 prévia (veo-2.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate prévia (veo-3.1-generate-preview)
Geração rápida do Veo 3.1 pré-lançamento (veo-3.1-fast-generate-preview)
Veo 3.1 Gerar (veo-3.1-generate-001)
Geração rápida do Veo 3.1 (veo-3.1-fast-generate-001)
Geração do Veo 3.1 Lite pré-lançamento (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição (chirp_3)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Pré-lançamento da TTS do Gemini 2.5 Flash Lite pré-lançamento (gemini-2.5-flash-lite-preview-tts)

Multirregional

Estados Unidos multirregião(us) União Europeia multirregional(eu)
Modelos do Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Criação de imagens do Gemini 3.1 Flash pré-lançamento (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro pré-lançamento (gemini-3.1-pro-preview)
Gemini 3 Flash pré-lançamento (gemini-3-flash-preview)
Gemini 3 Pro Image pré-lançamento (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pré-lançamento (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pré-lançamento (gemini-2.5-flash-lite-preview-09-2025)
Criação de Imagens do Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash com a API Gemini Live pré-lançamento (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Incorporação do Gemini (gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Veo nos modelos da Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Geração do Veo 2 prévia (veo-2.0-generate-exp)
Geração do Veo 2 prévia (veo-2.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate prévia (veo-3.1-generate-preview)
Geração rápida do Veo 3.1 pré-lançamento (veo-3.1-fast-generate-preview)
Veo 3.1 Gerar (veo-3.1-generate-001)
Geração rápida do Veo 3.1 (veo-3.1-fast-generate-001)
Geração do Veo 3.1 Lite pré-lançamento (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição (chirp_3)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Pré-lançamento da TTS do Gemini 2.5 Flash Lite pré-lançamento (gemini-2.5-flash-lite-preview-tts)

Estados Unidos

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina do Sul(us-east1) N. Virgínia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos do Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Criação de imagens do Gemini 3.1 Flash pré-lançamento (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro pré-lançamento (gemini-3.1-pro-preview)
Gemini 3 Flash pré-lançamento (gemini-3-flash-preview)
Gemini 3 Pro Image pré-lançamento (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pré-lançamento (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pré-lançamento (gemini-2.5-flash-lite-preview-09-2025)
Criação de Imagens do Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash com a API Gemini Live pré-lançamento (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Incorporação do Gemini (gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Veo nos modelos da Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Geração do Veo 2 prévia (veo-2.0-generate-exp)
Geração do Veo 2 prévia (veo-2.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate prévia (veo-3.1-generate-preview)
Geração rápida do Veo 3.1 pré-lançamento (veo-3.1-fast-generate-preview)
Veo 3.1 Gerar (veo-3.1-generate-001)
Geração rápida do Veo 3.1 (veo-3.1-fast-generate-001)
Geração do Veo 3.1 Lite pré-lançamento (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição (chirp_3)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Pré-lançamento da TTS do Gemini 2.5 Flash Lite pré-lançamento (gemini-2.5-flash-lite-preview-tts)

Américas

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos do Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Criação de imagens do Gemini 3.1 Flash pré-lançamento (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro pré-lançamento (gemini-3.1-pro-preview)
Gemini 3 Flash pré-lançamento (gemini-3-flash-preview)
Gemini 3 Pro Image pré-lançamento (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pré-lançamento (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pré-lançamento (gemini-2.5-flash-lite-preview-09-2025)
Criação de Imagens do Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash com a API Gemini Live pré-lançamento (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Incorporação do Gemini (gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Veo nos modelos da Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Geração do Veo 2 prévia (veo-2.0-generate-exp)
Geração do Veo 2 prévia (veo-2.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate prévia (veo-3.1-generate-preview)
Geração rápida do Veo 3.1 pré-lançamento (veo-3.1-fast-generate-preview)
Veo 3.1 Gerar (veo-3.1-generate-001)
Geração rápida do Veo 3.1 (veo-3.1-fast-generate-001)
Geração do Veo 3.1 Lite pré-lançamento (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição (chirp_3)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Pré-lançamento da TTS do Gemini 2.5 Flash Lite pré-lançamento (gemini-2.5-flash-lite-preview-tts)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Baixos(europe-west4) Zurique(europe-west6) Frankfurt(europe-west3) Finlândia(europe-north1) Varsóvia(europe-central2) Milão(europe-west8) Madri(europe-southwest1) Paris(europe-west9)
Modelos do Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Criação de imagens do Gemini 3.1 Flash pré-lançamento (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro pré-lançamento (gemini-3.1-pro-preview)
Gemini 3 Flash pré-lançamento (gemini-3-flash-preview)
Gemini 3 Pro Image pré-lançamento (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pré-lançamento (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pré-lançamento (gemini-2.5-flash-lite-preview-09-2025)
Criação de Imagens do Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash com a API Gemini Live pré-lançamento (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Incorporação do Gemini (gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Veo nos modelos da Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Geração do Veo 2 prévia (veo-2.0-generate-exp)
Geração do Veo 2 prévia (veo-2.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate prévia (veo-3.1-generate-preview)
Geração rápida do Veo 3.1 pré-lançamento (veo-3.1-fast-generate-preview)
Veo 3.1 Gerar (veo-3.1-generate-001)
Geração rápida do Veo 3.1 (veo-3.1-fast-generate-001)
Geração do Veo 3.1 Lite pré-lançamento (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição (chirp_3)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Pré-lançamento da TTS do Gemini 2.5 Flash Lite pré-lançamento (gemini-2.5-flash-lite-preview-tts)

Ásia-Pacífico

Mumbai(asia-south1) Singapura(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tóquio(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelos do Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Criação de imagens do Gemini 3.1 Flash pré-lançamento (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro pré-lançamento (gemini-3.1-pro-preview)
Gemini 3 Flash pré-lançamento (gemini-3-flash-preview)
Gemini 3 Pro Image pré-lançamento (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pré-lançamento (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pré-lançamento (gemini-2.5-flash-lite-preview-09-2025)
Criação de Imagens do Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash com a API Gemini Live pré-lançamento (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Incorporação do Gemini (gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Veo nos modelos da Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Geração do Veo 2 prévia (veo-2.0-generate-exp)
Geração do Veo 2 prévia (veo-2.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate prévia (veo-3.1-generate-preview)
Geração rápida do Veo 3.1 pré-lançamento (veo-3.1-fast-generate-preview)
Veo 3.1 Gerar (veo-3.1-generate-001)
Geração rápida do Veo 3.1 (veo-3.1-fast-generate-001)
Geração do Veo 3.1 Lite pré-lançamento (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição (chirp_3)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Pré-lançamento da TTS do Gemini 2.5 Flash Lite pré-lançamento (gemini-2.5-flash-lite-preview-tts)

Oriente Médio

Tel Aviv(me-west1) Doha(me-central1) Damã(me-central2)
Modelos do Gemini
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Criação de imagens do Gemini 3.1 Flash pré-lançamento (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro pré-lançamento (gemini-3.1-pro-preview)
Gemini 3 Flash pré-lançamento (gemini-3-flash-preview)
Gemini 3 Pro Image pré-lançamento (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash pré-lançamento (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite pré-lançamento (gemini-2.5-flash-lite-preview-09-2025)
Criação de Imagens do Gemini 2.5 Flash (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash com áudio nativo da API Gemini Live (gemini-live-2.5-flash-native-audio)
Gemini 2.0 Flash com a API Gemini Live pré-lançamento (gemini-2.0-flash-live-preview-04-09)
Modelos de embeddings
Gemini Embedding 2 (gemini-embedding-2)
Incorporação do Gemini (gemini-embedding-001)
Embeddings para texto
Embeddings para multimodal
Veo nos modelos da Gemini Enterprise Agent Platform
Veo 2 Generate (veo-2.0-generate-001)
Geração do Veo 2 prévia (veo-2.0-generate-exp)
Geração do Veo 2 prévia (veo-2.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-generate-preview)
Veo 3 Generate prévia (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate prévia (veo-3.1-generate-preview)
Geração rápida do Veo 3.1 pré-lançamento (veo-3.1-fast-generate-preview)
Veo 3.1 Gerar (veo-3.1-generate-001)
Geração rápida do Veo 3.1 (veo-3.1-fast-generate-001)
Geração do Veo 3.1 Lite pré-lançamento (veo-3.1-lite-generate-001)
Modelos de Speech-to-Text e Text-to-Speech
Chirp 3: transcrição (chirp_3)
Chirp 3: vozes em alta definição
Chirp 3: voz personalizada instantânea
Chirp 2: transcrição (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Pré-lançamento da TTS do Gemini 2.5 Flash Lite pré-lançamento (gemini-2.5-flash-lite-preview-tts)

Google Cloud locais de endpoints de modelos de parceiros

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos de parceiros de plataforma do Gemini Enterprise Agent Platform para MaaS.

Os endpoints de modelos de parceiros para a Agent Platform estão disponíveis nas seguintes regiões:

Global

Global(global)
Modelos da Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic (descontinuado)
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Multirregional

Estados Unidos multirregião(us) União Europeia multirregional(eu)
Modelos da Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic (descontinuado)
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Estados Unidos

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina do Sul(us-east1) N. Virgínia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos da Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic (descontinuado)
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Américas

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos da Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic (descontinuado)
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Baixos(europe-west4) Zurique(europe-west6) Frankfurt(europe-west3) Finlândia(europe-north1) Varsóvia(europe-central2) Milão(europe-west8) Madri(europe-southwest1) Paris(europe-west9)
Modelos da Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic (descontinuado)
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Ásia-Pacífico

Mumbai(asia-south1) Singapura(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tóquio(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelos da Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic (descontinuado)
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Oriente Médio

Tel Aviv(me-west1) Doha(me-central1) Damã(me-central2)
Modelos da Anthropic
Claude Opus 4.7
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Claude 3.7 Sonnet da Anthropic
Claude 3.5 Haiku da Anthropic
Haiku do Claude 3 da Anthropic (descontinuado)
Modelos da Mistral
Mistral Medium 3
OCR do Mistral (25/05)
Mistral Small 3.1 (25/03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud locais de endpoints de modelos abertos

O Google atende às solicitações da região especificada. Para alguns modelos, o Google também oferece um endpoint global para melhorar a disponibilidade geral e reduzir as taxas de erros. O endpoint global pode ter um conjunto separado de cotas do endpoint regional e não é compatível com requisitos de residência de dados. Para mais informações, consulte a seção "Endpoint regional e global" em Modelos abertos da plataforma de agentes do Gemini Enterprise para MaaS.

Os endpoints de modelo aberto para a Agent Platform estão disponíveis nas seguintes regiões:

Global

Global(global)
Modelos DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos do ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos da OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos da Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 Large multilíngue (multilingual-e5-large-instruct-maas)

Multirregional

Estados Unidos multirregião(us) União Europeia multirregional(eu)
Modelos DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos do ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos da OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos da Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 Large multilíngue (multilingual-e5-large-instruct-maas)

Estados Unidos

Oregon(us-west1) Las Vegas(us-west4) Iowa(us-central1) Carolina do Sul(us-east1) N. Virgínia(us-east4) Columbus(us-east5) Dallas(us-south1)
Modelos DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos do ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos da OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos da Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 Large multilíngue (multilingual-e5-large-instruct-maas)

Américas

Montreal(northamerica-northeast1) São Paulo(southamerica-east1)
Modelos DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos do ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos da OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos da Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 Large multilíngue (multilingual-e5-large-instruct-maas)

Europa

Londres(europe-west2) Bélgica(europe-west1) Países Baixos(europe-west4) Zurique(europe-west6) Frankfurt(europe-west3) Finlândia(europe-north1) Varsóvia(europe-central2) Milão(europe-west8) Madri(europe-southwest1) Paris(europe-west9)
Modelos DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos do ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos da OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos da Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 Large multilíngue (multilingual-e5-large-instruct-maas)

Ásia-Pacífico

Mumbai(asia-south1) Singapura(asia-southeast1) Hong Kong(asia-east2) Taiwan(asia-east1) Tóquio(asia-northeast1) Sydney(australia-southeast1) Seul(asia-northeast3)
Modelos DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos do ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos da OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos da Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 Large multilíngue (multilingual-e5-large-instruct-maas)

Oriente Médio

Tel Aviv(me-west1) Doha(me-central1) Damã(me-central2)
Modelos DeepSeek
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
Modelos do ZAI.org
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
Modelos da OpenAI
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Modelos da Moonshot AI
Kimi K2 Thinking (kimi-k2-thinking-maas)
Modelos Llama
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
Modelos MiniMax
MiniMax M2 (minimax-m2-maas)
Modelos Qwen
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
Modelos e5
Multilingual E5 Small (multilingual-e5-small-maas)
E5 Large multilíngue (multilingual-e5-large-instruct-maas)