部署和端点

Gemini Enterprise Agent Platform 上的 Google 及合作伙伴模型以及生成式 AI 功能以特定区域级端点和全球端点的形式公开。全球端点覆盖全球,与单区域相比,可提供更高的可用性和可靠性。

指定端点

对于标准区域端点(例如 us-central)和全球端点:

Python

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='GOOGLE_CLOUD_PROJECT', location='GOOGLE_CLOUD_LOCATION')

Python

client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION"
MODEL_ID="MODEL_ID"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "https://${GOOGLE_CLOUD_LOCATION}$-aiplatform.googleapis.com/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words."
      }
    }
  }'

多区域端点

借助多区域端点,您可以确保服务对客户数据进行的机器学习处理始终在特定管辖区边界内,例如美国或欧盟。

下表列出了多区域端点的主机名:

多区域 位置 主机名
美国 us https://aiplatform.us.rep.googleapis.com
欧盟 eu https://aiplatform.eu.rep.googleapis.com

Python

import vertexai
from google.adk.agents import Agent

# Set the multi-region location on the client
client = vertexai.Client(
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

# The agent will use this configuration
agent = Agent(
    model="gemini-2.5-flash",
    name='my_agent'
)

Python

from google import genai

# location must be set to 'us' or 'eu' for multi-region routing
client = genai.Client(
    enterprise=True,
    project='GOOGLE_CLOUD_PROJECT',
    location='GOOGLE_CLOUD_LOCATION'
)

REST

GOOGLE_CLOUD_PROJECT="GOOGLE_CLOUD_PROJECT"
MODEL_ID="MODEL_ID"
GOOGLE_CLOUD_LOCATION="GOOGLE_CLOUD_LOCATION" # Must be 'us' or 'eu'
# Explicitly use the .rep. hostname for multi-region endpoints
API_ENDPOINT="https://aiplatform.${GOOGLE_CLOUD_LOCATION}.rep.googleapis.com"

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  "${API_ENDPOINT}/v1/projects/${GOOGLE_CLOUD_PROJECT}/locations/${GOOGLE_CLOUD_LOCATION}/publishers/google/models/${MODEL_ID}:generateContent" \
  -d '{
    "contents": {
      "role": "user",
      "parts": {
        "text": "Explain how AI works in a few words"
      }
    }
  }'

全球端点

为请求选择全球端点可以提高整体可用性,同时减少资源耗尽 (429) 错误。如果您有机器学习处理要求,请勿使用全球端点,因为在发出请求时,您无法控制或知道自己的机器学习处理请求会发送到哪个区域。

支持的模型

以下 Google 模型支持在指定区域中使用全球端点。如需详细了解哪些模型支持全球端点,请参阅 Google 模型端点位置表中的全球标签页。

如需了解合作伙伴模型的全球端点可用性,请参阅 Google Cloud 合作伙伴模型端点位置表中的全球标签页。

限制

使用全球端点时,以下功能不可用:

  • 调优
  • Anthropic 和 OpenMaaS 模型的批量预测
  • 检索增强生成 (RAG) 语料库(支持 RAG 请求)

只有以下模型支持将全球端点与预配吞吐量搭配使用:

点击可查看使用预配吞吐量时全球端点支持的模型

模型 支持的最新模型版本
Gemini 3.5 Flash gemini-3.5-flash
Gemini 3.1 Flash-Lite gemini-3.1-flash-lite
Gemini 3.1 Flash Image 预览版 gemini-3.1-flash-image-preview
Gemini 3.1 Pro 预览版 gemini-3.1-pro-preview
Gemini 3 Flash 预览版 gemini-3-flash-preview
Gemini 3 Pro Image 预览版 gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash 预览版 gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite 预览版 gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash 图片 gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite

Google 模型端点位置

Gemini Enterprise Agent Platform 中的 Google 模型适用于以下端点:

全球

全球(全球)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 预览版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 预览版 (gemini-3.1-pro-preview)
Gemini 3 Flash 预览版 (gemini-3-flash-preview)
Gemini 3 Pro Image 预览版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 预览版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 预览版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash 图片 (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
支持 Gemini Live API 原生音频的 Gemini 2.5 Flash (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash(支持 Gemini Live API 原生音频功能) 预览版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
支持 Gemini Live API 的 Gemini 2.0 Flash 预览版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Gemini Enterprise Agent Platform 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 预览版 (veo-2.0-generate-exp)
Veo 2 Generate 预览版 (veo-2.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate 预览版 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 预览版 (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate 预览版 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:转写 (chirp_3)
Chirp 3:高清语音
Chirp 3:即时自定义语音
Chirp 2:转写 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 预览版 TTS 预览版 (gemini-2.5-flash-lite-preview-tts)

多区域

美国多区域(us) 欧盟多区域(eu)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 预览版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 预览版 (gemini-3.1-pro-preview)
Gemini 3 Flash 预览版 (gemini-3-flash-preview)
Gemini 3 Pro Image 预览版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 预览版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 预览版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash 图片 (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
支持 Gemini Live API 原生音频的 Gemini 2.5 Flash (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash(支持 Gemini Live API 原生音频功能) 预览版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
支持 Gemini Live API 的 Gemini 2.0 Flash 预览版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Gemini Enterprise Agent Platform 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 预览版 (veo-2.0-generate-exp)
Veo 2 Generate 预览版 (veo-2.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate 预览版 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 预览版 (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate 预览版 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:转写 (chirp_3)
Chirp 3:高清语音
Chirp 3:即时自定义语音
Chirp 2:转写 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 预览版 TTS 预览版 (gemini-2.5-flash-lite-preview-tts)

美国

俄勒冈(us-west1) 拉斯维加斯(us-west4) 爱荷华(us-central1) 南卡罗来纳(us-east1) 北弗吉尼亚(us-east4) 哥伦布(us-east5) 达拉斯(us-south1)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 预览版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 预览版 (gemini-3.1-pro-preview)
Gemini 3 Flash 预览版 (gemini-3-flash-preview)
Gemini 3 Pro Image 预览版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 预览版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 预览版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash 图片 (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
支持 Gemini Live API 原生音频的 Gemini 2.5 Flash (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash(支持 Gemini Live API 原生音频功能) 预览版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
支持 Gemini Live API 的 Gemini 2.0 Flash 预览版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Gemini Enterprise Agent Platform 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 预览版 (veo-2.0-generate-exp)
Veo 2 Generate 预览版 (veo-2.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate 预览版 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 预览版 (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate 预览版 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:转写 (chirp_3)
Chirp 3:高清语音
Chirp 3:即时自定义语音
Chirp 2:转写 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 预览版 TTS 预览版 (gemini-2.5-flash-lite-preview-tts)

美洲

蒙特利尔(northamerica-northeast1) 圣保罗(southamerica-east1)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 预览版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 预览版 (gemini-3.1-pro-preview)
Gemini 3 Flash 预览版 (gemini-3-flash-preview)
Gemini 3 Pro Image 预览版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 预览版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 预览版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash 图片 (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
支持 Gemini Live API 原生音频的 Gemini 2.5 Flash (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash(支持 Gemini Live API 原生音频功能) 预览版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
支持 Gemini Live API 的 Gemini 2.0 Flash 预览版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Gemini Enterprise Agent Platform 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 预览版 (veo-2.0-generate-exp)
Veo 2 Generate 预览版 (veo-2.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate 预览版 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 预览版 (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate 预览版 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:转写 (chirp_3)
Chirp 3:高清语音
Chirp 3:即时自定义语音
Chirp 2:转写 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 预览版 TTS 预览版 (gemini-2.5-flash-lite-preview-tts)

欧洲

伦敦(europe-west2) 比利时 (europe-west1) 荷兰 (europe-west4) 苏黎世(europe-west6) 法兰克福(europe-west3) 芬兰(europe-north1) 华沙(europe-central2) 米兰(europe-west8) 马德里(europe-southwest1) 巴黎(europe-west9)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 预览版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 预览版 (gemini-3.1-pro-preview)
Gemini 3 Flash 预览版 (gemini-3-flash-preview)
Gemini 3 Pro Image 预览版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 预览版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 预览版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash 图片 (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
支持 Gemini Live API 原生音频的 Gemini 2.5 Flash (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash(支持 Gemini Live API 原生音频功能) 预览版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
支持 Gemini Live API 的 Gemini 2.0 Flash 预览版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Gemini Enterprise Agent Platform 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 预览版 (veo-2.0-generate-exp)
Veo 2 Generate 预览版 (veo-2.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate 预览版 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 预览版 (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate 预览版 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:转写 (chirp_3)
Chirp 3:高清语音
Chirp 3:即时自定义语音
Chirp 2:转写 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 预览版 TTS 预览版 (gemini-2.5-flash-lite-preview-tts)

亚太地区

孟买(asia-south1) 新加坡 (asia-southeast1) 香港(asia-east2) 台湾 (asia-east1) 东京(asia-northeast1) 悉尼(australia-southeast1) 首尔(asia-northeast3)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 预览版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 预览版 (gemini-3.1-pro-preview)
Gemini 3 Flash 预览版 (gemini-3-flash-preview)
Gemini 3 Pro Image 预览版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 预览版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 预览版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash 图片 (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
支持 Gemini Live API 原生音频的 Gemini 2.5 Flash (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash(支持 Gemini Live API 原生音频功能) 预览版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
支持 Gemini Live API 的 Gemini 2.0 Flash 预览版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Gemini Enterprise Agent Platform 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 预览版 (veo-2.0-generate-exp)
Veo 2 Generate 预览版 (veo-2.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate 预览版 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 预览版 (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate 预览版 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:转写 (chirp_3)
Chirp 3:高清语音
Chirp 3:即时自定义语音
Chirp 2:转写 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 预览版 TTS 预览版 (gemini-2.5-flash-lite-preview-tts)

中东

特拉维夫(me-west1) 多哈(me-central1) 达曼(me-central2)
Gemini 模型
Gemini 3.5 Flash (gemini-3.5-flash)
Gemini 3.1 Flash-Lite (gemini-3.1-flash-lite)
Gemini 3.1 Flash Image 预览版 (gemini-3.1-flash-image-preview)
Gemini 3.1 Pro 预览版 (gemini-3.1-pro-preview)
Gemini 3 Flash 预览版 (gemini-3-flash-preview)
Gemini 3 Pro Image 预览版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 预览版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 预览版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash 图片 (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
支持 Gemini Live API 原生音频的 Gemini 2.5 Flash (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash(支持 Gemini Live API 原生音频功能) 预览版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
支持 Gemini Live API 的 Gemini 2.0 Flash 预览版 (gemini-2.0-flash-live-preview-04-09)
嵌入模型
Gemini Embedding 2 (gemini-embedding-2)
Gemini Embedding (gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Gemini Enterprise Agent Platform 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 Generate 预览版 (veo-2.0-generate-exp)
Veo 2 Generate 预览版 (veo-2.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-generate-preview)
Veo 3 Generate 预览版 (veo-3.0-fast-generate-preview)
Veo 3 Generate (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 Generate 预览版 (veo-3.1-generate-preview)
Veo 3.1 Fast Generate 预览版 (veo-3.1-fast-generate-preview)
Veo 3.1 Generate (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Veo 3.1 Lite Generate 预览版 (veo-3.1-lite-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:转写 (chirp_3)
Chirp 3:高清语音
Chirp 3:即时自定义语音
Chirp 2:转写 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 预览版 TTS 预览版 (gemini-2.5-flash-lite-preview-tts)

Google Cloud 合作伙伴模型端点位置

Google 会从您指定的区域处理请求。对于部分模型,Google 还提供全球端点,以提高整体可用性并降低错误率。全球端点的配额可以独立于区域级端点而单独计算,并且不支持数据驻留要求。如需了解详情,请参阅 Gemini Enterprise Agent Platform 中以 MaaS 形式提供的合作伙伴模型中的“区域级端点和全球端点”部分。

Agent Platform 合作伙伴模型端点在以下区域提供:

全球

全球(全球)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku(已弃用)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

多区域

美国多区域(us) 欧盟多区域(eu)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku(已弃用)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

美国

俄勒冈(us-west1) 拉斯维加斯(us-west4) 爱荷华(us-central1) 南卡罗来纳(us-east1) 北弗吉尼亚(us-east4) 哥伦布(us-east5) 达拉斯(us-south1)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku(已弃用)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

美洲

蒙特利尔(northamerica-northeast1) 圣保罗(southamerica-east1)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku(已弃用)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

欧洲

伦敦(europe-west2) 比利时 (europe-west1) 荷兰 (europe-west4) 苏黎世(europe-west6) 法兰克福(europe-west3) 芬兰(europe-north1) 华沙(europe-central2) 米兰(europe-west8) 马德里(europe-southwest1) 巴黎(europe-west9)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku(已弃用)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

亚太地区

孟买(asia-south1) 新加坡 (asia-southeast1) 香港(asia-east2) 台湾 (asia-east1) 东京(asia-northeast1) 悉尼(australia-southeast1) 首尔(asia-northeast3)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku(已弃用)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

中东

特拉维夫(me-west1) 多哈(me-central1) 达曼(me-central2)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.6
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku(已弃用)
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud 开放模型端点位置

Google 会从您指定的区域处理请求。对于部分模型,Google 还提供全球端点,以提高整体可用性并降低错误率。全球端点的配额可以独立于区域级端点而单独计算,并且不支持数据驻留要求。如需了解详情,请参阅 Gemini Enterprise Agent Platform 中以 MaaS 形式提供的开放模型中的“区域级端点和全球端点”部分。

代理平台开放模型端点可在以下区域使用:

全球

全球(全球)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 型号
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

多区域

美国多区域(us) 欧盟多区域(eu)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 思考 (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 型号
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

美国

俄勒冈(us-west1) 拉斯维加斯(us-west4) 爱荷华(us-central1) 南卡罗来纳(us-east1) 北弗吉尼亚(us-east4) 哥伦布(us-east5) 达拉斯(us-south1)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 型号
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

美洲

蒙特利尔(northamerica-northeast1) 圣保罗(southamerica-east1)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 思考 (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 型号
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

欧洲

伦敦(europe-west2) 比利时 (europe-west1) 荷兰 (europe-west4) 苏黎世(europe-west6) 法兰克福(europe-west3) 芬兰(europe-north1) 华沙(europe-central2) 米兰(europe-west8) 马德里(europe-southwest1) 巴黎(europe-west9)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 型号
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

亚太地区

孟买(asia-south1) 新加坡 (asia-southeast1) 香港(asia-east2) 台湾 (asia-east1) 东京(asia-northeast1) 悉尼(australia-southeast1) 首尔(asia-northeast3)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 型号
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)

中东

特拉维夫(me-west1) 多哈(me-central1) 达曼(me-central2)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 思考 (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 型号
Multilingual E5 Small (multilingual-e5-small-maas)
Multilingual E5 Large (multilingual-e5-large-instruct-maas)