部署和端點

Vertex AI 上的 Google 和合作夥伴模型以及生成式 AI 功能,會以特定區域端點和全域端點的形式公開。全域端點涵蓋全球,可用性和可靠性都比單一區域更高。

全域端點

為要求選取全域端點,可提高整體可用性,同時減少資源耗盡 (429) 錯誤。如有機器學習處理要求,請勿使用全域端點,因為發出要求時,您無法控管或瞭解機器學習處理要求傳送至哪個區域。

支援的模型

在特定區域,下列 Google 模型支援使用全域端點。如要瞭解哪些區域支援全域端點,請參閱Google 模型端點位置表中的「全球」分頁。

如要瞭解合作夥伴模型在全球端點的可用情形,請參閱Google Cloud 合作夥伴模型端點位置表中的「全球」分頁。

使用全域端點

如要使用全域端點,請從端點名稱中排除位置,並將資源位置設為 global。舉例來說,下列是全域端點網址:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

如果是 Google Gen AI SDK,請建立使用 global 位置的用戶端:

# google-genai >= 0.8.0 is required
client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

如要使用 Python 適用的 Vertex AI SDK,請使用 global 位置初始化 SDK:

# google-cloud-aiplatform >= 1.79.0 is required
import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

限制

使用全球端點時,無法使用下列功能:

  • 調整
  • Anthropic 和 OpenMaaS 模型的批次預測
  • 檢索增強生成 (RAG) 語料庫 (支援 RAG 要求)

搭配佈建輸送量使用全域端點時,僅適用於下列模型:

使用佈建輸送量時,按一下即可查看全域端點支援的模型

型號 最新支援的模型版本
Gemini 3 Flash 預先發布版 gemini-3-flash-preview
Gemini 3 Pro 預先發布版 gemini-3-pro-preview
Gemini 3 Pro Image 預先發布版 gemini-3-pro-image-preview
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash 預先發布版 gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite 預先發布版 gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image gemini-2.5-flash-image
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Google 模型端點位置

Vertex AI 中的 Google 模型適用於下列端點:

全球

全域(全域)
Gemini 模型
Gemini 3 Flash 預覽版 (gemini-3-flash-preview)
Gemini 3 Pro 預先發布版 (gemini-3-pro-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預先發布版 (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
嵌入模型
Gemini Embeddings (gemini-embeddings-001)
文字嵌入
多模態專用的 Embeddings
Vertex AI 模型上的 Imagen
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 受控自訂 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Vertex AI 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 生成 預覽 (veo-2.0-generate-exp)
Veo 2 生成 預覽 (veo-2.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 快速生成 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

美國

奧勒岡州(us-west1) 拉斯維加斯(us-west4) 愛荷華州(us-central1) 南卡羅來納州(us-east1) 北維吉尼亞州(us-east4) 哥倫布(us-east5) 達拉斯(us-south1)
Gemini 模型
Gemini 3 Flash 預覽版 (gemini-3-flash-preview)
Gemini 3 Pro 預先發布版 (gemini-3-pro-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預先發布版 (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
嵌入模型
Gemini Embeddings (gemini-embeddings-001)
文字嵌入
多模態專用的 Embeddings
Vertex AI 模型上的 Imagen
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 受控自訂 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Vertex AI 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 生成 預覽 (veo-2.0-generate-exp)
Veo 2 生成 預覽 (veo-2.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 快速生成 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

美洲

蒙特婁(northamerica-northeast1) 聖保羅(southamerica-east1)
Gemini 模型
Gemini 3 Flash 預覽版 (gemini-3-flash-preview)
Gemini 3 Pro 預先發布版 (gemini-3-pro-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預先發布版 (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
嵌入模型
Gemini Embeddings (gemini-embeddings-001)
文字嵌入
多模態專用的 Embeddings
Vertex AI 模型上的 Imagen
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 受控自訂 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Vertex AI 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 生成 預覽 (veo-2.0-generate-exp)
Veo 2 生成 預覽 (veo-2.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 快速生成 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

歐洲

倫敦(europe-west2) 比利時(europe-west1) 荷蘭(europe-west4) 蘇黎世(europe-west6) 法蘭克福(europe-west3) 芬蘭(europe-north1) 華沙(europe-central2) 米蘭(europe-west8) 馬德里(europe-southwest1) 巴黎(europe-west9)
Gemini 模型
Gemini 3 Flash 預覽版 (gemini-3-flash-preview)
Gemini 3 Pro 預先發布版 (gemini-3-pro-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預先發布版 (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
嵌入模型
Gemini Embeddings (gemini-embeddings-001)
文字嵌入
多模態專用的 Embeddings
Vertex AI 模型上的 Imagen
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 受控自訂 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Vertex AI 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 生成 預覽 (veo-2.0-generate-exp)
Veo 2 生成 預覽 (veo-2.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 快速生成 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

亞太地區

孟買(asia-south1) 新加坡(asia-southeast1) 香港(asia-east2) 臺灣(asia-east1) 東京(asia-northeast1) 雪梨(australia-southeast1) 首爾(asia-northeast3)
Gemini 模型
Gemini 3 Flash 預覽版 (gemini-3-flash-preview)
Gemini 3 Pro 預先發布版 (gemini-3-pro-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預先發布版 (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
嵌入模型
Gemini Embeddings (gemini-embeddings-001)
文字嵌入
多模態專用的 Embeddings
Vertex AI 模型上的 Imagen
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 受控自訂 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Vertex AI 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 生成 預覽 (veo-2.0-generate-exp)
Veo 2 生成 預覽 (veo-2.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 快速生成 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

中東

特拉維夫(me-west1) 杜哈(me-central1) 達曼(me-central2)
Gemini 模型
Gemini 3 Flash 預覽版 (gemini-3-flash-preview)
Gemini 3 Pro 預先發布版 (gemini-3-pro-preview)
Gemini 3 Pro Image 預先發布版 (gemini-3-pro-image-preview)
Gemini 2.5 Pro (gemini-2.5-pro)
Gemini 2.5 Flash 預先發布版 (gemini-2.5-flash-preview-09-2025)
Gemini 2.5 Flash-Lite 預先發布版 (gemini-2.5-flash-lite-preview-09-2025)
Gemini 2.5 Flash Image (gemini-2.5-flash-image)
Gemini 2.5 Flash (gemini-2.5-flash)
Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 (gemini-live-2.5-flash-native-audio)
Gemini 2.5 Flash,搭配 Gemini Live API 原生音訊 預先發布版 (gemini-live-2.5-flash-preview-native-audio-09-2025)
Gemini 2.0 Flash with Gemini Live API 預先發布版 (gemini-2.0-flash-live-preview-04-09)
Gemini 2.0 Flash (gemini-2.0-flash)
Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)
嵌入模型
Gemini Embeddings (gemini-embeddings-001)
文字嵌入
多模態專用的 Embeddings
Vertex AI 模型上的 Imagen
Imagen 3 (imagen-3.0-generate-002)
Imagen 3 (imagen-3.0-generate-001)
Imagen 3 Fast (imagen-3.0-fast-generate-001)
Imagen 3 受控自訂 (imagen-3.0-capability-001)
Imagen 4 (imagen-4.0-generate-001)
Imagen 4 (imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate (imagen-4.0-ultra-generate-001)
Vertex AI 模型上的 Veo
Veo 2 生成 (veo-2.0-generate-001)
Veo 2 生成 預覽 (veo-2.0-generate-exp)
Veo 2 生成 預覽 (veo-2.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-generate-preview)
Veo 3 生成 預先發布版 (veo-3.0-fast-generate-preview)
Veo 3 生成 (veo-3.0-generate-001)
Veo 3 Fast Generate (veo-3.0-fast-generate-001)
Veo 3.1 生成 預覽 (veo-3.1-generate-preview)
Veo 3.1 快速生成 預覽 (veo-3.1-fast-generate-preview)
Veo 3.1 生成 (veo-3.1-generate-001)
Veo 3.1 Fast Generate (veo-3.1-fast-generate-001)
Speech-to-Text 和 Text-to-Speech 模型
Chirp 3:轉錄 (chirp_3)
Chirp 3:HD 語音
Chirp 3:即時 Custom Voice
Chirp 2:轉錄 (chirp_2)
Gemini 2.5 Pro TTS (gemini-2.5-pro-tts)
Gemini 2.5 Flash TTS (gemini-2.5-flash-tts)
Gemini 2.5 Flash Lite 預先發布版 TTS 預先發布版 (gemini-2.5-flash-lite-preview-tts)

Google Cloud 合作夥伴模型端點位置

Google 會從您指定的區域提供要求。對於部分模型,Google 也提供全球端點,以提升整體可用性並降低錯誤率。全域端點的配額可能與區域端點不同,且不支援資料落地規定。詳情請參閱「 Vertex AI partner models for MaaS」一文的「Regional and global endpoint」一節。

Vertex AI 的生成式 AI 合作夥伴模型端點適用於下列區域:

全球

全域(全域)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

美國

奧勒岡州(us-west1) 拉斯維加斯(us-west4) 愛荷華州(us-central1) 南卡羅來納州(us-east1) 北維吉尼亞州(us-east4) 哥倫布(us-east5) 達拉斯(us-south1)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

美洲

蒙特婁(northamerica-northeast1) 聖保羅(southamerica-east1)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

歐洲

倫敦(europe-west2) 比利時(europe-west1) 荷蘭(europe-west4) 蘇黎世(europe-west6) 法蘭克福(europe-west3) 芬蘭(europe-north1) 華沙(europe-central2) 米蘭(europe-west8) 馬德里(europe-southwest1) 巴黎(europe-west9)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

亞太地區

孟買(asia-south1) 新加坡(asia-southeast1) 香港(asia-east2) 臺灣(asia-east1) 東京(asia-northeast1) 雪梨(australia-southeast1) 首爾(asia-northeast3)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

中東

特拉維夫(me-west1) 杜哈(me-central1) 達曼(me-central2)
Anthropic 模型
Claude Opus 4.6
Claude Opus 4.5
Claude Sonnet 4.5
Claude Opus 4.1
Claude Haiku 4.5
Claude Opus 4
Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral 模型
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large (24.07)
Codestral 2
Codestral (24.05)

Google Cloud 開放模型端點位置

Google 會從您指定的區域提供要求。對於部分模型,Google 也提供全球端點,以提升整體可用性並降低錯誤率。全域端點的配額可能與區域端點不同,且不支援資料落地規定。詳情請參閱「 Vertex AI open models for MaaS」一文中的「Regional and global endpoint」一節。

Vertex AI 中的生成式 AI 開放模型端點適用於下列區域:

全球

全域(全域)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
多語言 E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

美國

奧勒岡州(us-west1) 拉斯維加斯(us-west4) 愛荷華州(us-central1) 南卡羅來納州(us-east1) 北維吉尼亞州(us-east4) 哥倫布(us-east5) 達拉斯(us-south1)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
多語言 E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

美洲

蒙特婁(northamerica-northeast1) 聖保羅(southamerica-east1)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
多語言 E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

歐洲

倫敦(europe-west2) 比利時(europe-west1) 荷蘭(europe-west4) 蘇黎世(europe-west6) 法蘭克福(europe-west3) 芬蘭(europe-north1) 華沙(europe-central2) 米蘭(europe-west8) 馬德里(europe-southwest1) 巴黎(europe-west9)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
多語言 E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

亞太地區

孟買(asia-south1) 新加坡(asia-southeast1) 香港(asia-east2) 臺灣(asia-east1) 東京(asia-northeast1) 雪梨(australia-southeast1) 首爾(asia-northeast3)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
多語言 E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

中東

特拉維夫(me-west1) 杜哈(me-central1) 達曼(me-central2)
Deepseek 模型
DeepSeek-OCR (deepseek-ocr-maas)
DeepSeek-V3.2 (deepseek-v3.2-maas)
DeepSeek-V3.1 (deepseek-v3.1-maas)
DeepSeek R1 (0528) (deepseek-r1-0528-maas)
ZAI.org 模型
GLM 4.7 (glm-4.7-maas)
GLM 5 (glm-5-maas)
OpenAI 模型
gpt-oss 120B (gpt-oss-120b-maas)
gpt-oss 20B (gpt-oss-20b-maas)
Moonshot AI 模型
Kimi K2 Thinking (kimi-k2-thinking-maas)
Llama 模型
Llama 3.3 70B
Llama 4 Maverick 17B-128E
Llama 4 Scout 17B-16E
MiniMax 模型
MiniMax M2 (minimax-m2-maas)
Qwen 模型
Qwen3-Next-80B Thinking (qwen3-next-80b-a3b-thinking-maas)
Qwen3-Next-80B Instruct (qwen3-next-80b-a3b-instruct-maas)
Qwen3 Coder (qwen3-coder-480b-a35b-instruct-maas)
Qwen3 235B (qwen3-235b-a22b-instruct-2507-maas)
e5 模型
多語言 E5 Small (multilingual-e5-small-maas)
多語言 E5 Large (multilingual-e5-large-instruct-maas)

後續步驟