数据驻留

以静态方式存储在客户所选位置的数据会一直以静态方式存储在该位置,而不会因客户请求调用的 Vertex AI 上的生成式 AI 端点而发生变化。

ML 处理

Vertex AI 上的生成式 AI 服务的机器学习 (ML) 处理会在发出请求的特定单区域或多区域内进行。

对于下表中未明确列出的任何区域端点(例如中东的端点),我们无法保证 ML 处理会在特定位置进行。这些端点支持不提供机器学习处理保证的旧版模型。

Google Cloud 模型支持

如需了解哪些功能支持数据驻留,请参阅支持的功能

多区域

型号 美国多区域 欧盟多区域
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
Gemini 2.5 Flash Image(gemini-2.5-flash-image)
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
针对 Gemini 2.5 Flash (gemini-2.5-flash) 进行调优
针对 Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite) 进行调优
针对 Gemini 2.5 Pro (gemini-2.5-pro) 进行调优
Gemini 2.0 Flash(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
针对 Gemini 2.0 Flash (gemini-2.0-flash-001) 进行调优
针对 Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite-001) 进行调优
Gemini Embeddings(gemini-embedding-001)
Chirp 2:转写(chirp_2)
Chirp 3:转写chirp_3
Chirp 3:高清语音
Chirp 3:即时自定义语音
Imagen 2(imagegeneration@005)
Embeddings for Multimodal
Embeddings for Text(text-embedding-004)
Embeddings for Text(text-embedding-005)
Embeddings for Text(text-multilingual-embedding-002)

美洲

型号 加拿大 (northamerica-northeast1)
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
Gemini 2.5 Flash Image(gemini-2.5-flash-image)
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
针对 Gemini 2.5 Flash (gemini-2.5-flash) 进行调优
针对 Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite) 进行调优
针对 Gemini 2.5 Pro (gemini-2.5-pro) 进行调优
Gemini 2.0 Flash(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
针对 Gemini 2.0 Flash (gemini-2.0-flash-001) 进行调优
针对 Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite-001) 进行调优
Gemini Embeddings(gemini-embedding-001)
Chirp 2:转写(chirp_2)
Chirp 3:转写chirp_3
Chirp 3:高清语音
Chirp 3:即时自定义语音
Imagen 2(imagegeneration@005)
Embeddings for Multimodal
Embeddings for Text(text-embedding-004)
Embeddings for Text(text-embedding-005)
Embeddings for Text(text-multilingual-embedding-002)

欧洲

型号 法国(europe-west9) 英国(europe-west2) 德国(europe-west3) 荷兰 (europe-west4)
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
Gemini 2.5 Flash Image(gemini-2.5-flash-image)
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
针对 Gemini 2.5 Flash (gemini-2.5-flash) 进行调优
针对 Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite) 进行调优
针对 Gemini 2.5 Pro (gemini-2.5-pro) 进行调优
Gemini 2.0 Flash(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
针对 Gemini 2.0 Flash (gemini-2.0-flash-001) 进行调优
针对 Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite-001) 进行调优
Gemini Embeddings(gemini-embedding-001)
Chirp 2:转写(chirp_2)
Chirp 3:转写chirp_3
Chirp 3:高清语音
Chirp 3:即时自定义语音
Imagen 2(imagegeneration@005)
Embeddings for Multimodal
Embeddings for Text(text-embedding-004)
Embeddings for Text(text-embedding-005)
Embeddings for Text(text-multilingual-embedding-002)

亚太地区

型号 日本(asia-northeast1) 澳大利亚(australia-southeast1) 印度 (asia-south1) 新加坡 (asia-southeast1) 韩国(asia-northeast3)
Gemini 2.5 Flash, 128k(gemini-2.5-flash)
Gemini 2.5 Flash, 1M(gemini-2.5-flash)
Gemini 2.5 Flash Image(gemini-2.5-flash-image)
Gemini 2.5 Flash-Lite(gemini-2.5-flash-lite)
Gemini 2.5 Pro, 1M(gemini-2.5-pro)
Gemini 2.5 Pro, 128k(gemini-2.5-pro)
针对 Gemini 2.5 Flash (gemini-2.5-flash) 进行调优
针对 Gemini 2.5 Flash-Lite (gemini-2.5-flash-lite) 进行调优
针对 Gemini 2.5 Pro (gemini-2.5-pro) 进行调优
Gemini 2.0 Flash(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite(gemini-2.0-flash-lite-001)
针对 Gemini 2.0 Flash (gemini-2.0-flash-001) 进行调优
针对 Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite-001) 进行调优
Gemini Embeddings(gemini-embedding-001)
Chirp 2:转写(chirp_2)
Chirp 3:转写chirp_3
Chirp 3:高清语音
Chirp 3:即时自定义语音
Imagen 2(imagegeneration@005)
Embeddings for Multimodal
Embeddings for Text(text-embedding-004)
Embeddings for Text(text-embedding-005)
Embeddings for Text(text-multilingual-embedding-002)

Google Cloud 合作伙伴模型支持

多区域

型号 美国多区域 欧盟多区域
Anthropic 的 Claude Haiku 4.5
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Anthropic 的 Claude 3.7 Sonnet(已弃用)
Codestral (24.05)
Codestral 2
Mistral Large (24.07)
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)

欧洲

型号 比利时 (europe-west1) 荷兰 (europe-west4)
Anthropic 的 Claude Haiku 4.5
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Anthropic 的 Claude 3.7 Sonnet(已弃用)
Codestral (24.05)
Codestral 2
Mistral Large (24.07)
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)

亚太地区

型号 新加坡 (asia-southeast1) 台湾 (asia-east1)
Anthropic 的 Claude Haiku 4.5
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Anthropic 的 Claude 3.7 Sonnet(已弃用)
Codestral (24.05)
Codestral 2
Mistral Large (24.07)
Mistral Medium 3
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)

Google Cloud 开放模型支持

多区域

型号 美国多区域 欧盟多区域
DeepSeek-OCR
DeepSeek R1 (0528)
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 思考
Llama 3.1 70B(预览版)
Llama 3.1 8B(预览版)
Llama 3.2 90B(预览版)
Llama 3.3 70B(预览版)
Llama 3.1 405B
Llama 4 Maverick 17B-128E(预览版)
Llama 4 Scout 17B-16E(预览版)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

欧洲

型号 比利时 (europe-west1) 荷兰 (europe-west4)
DeepSeek-OCR
DeepSeek R1 (0528)
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 思考
Llama 3.1 70B(预览版)
Llama 3.1 8B(预览版)
Llama 3.2 90B(预览版)
Llama 3.3 70B(预览版)
Llama 3.1 405B
Llama 4 Maverick 17B-128E(预览版)
Llama 4 Scout 17B-16E(预览版)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

亚太地区

型号 新加坡 (asia-southeast1) 台湾 (asia-east1)
DeepSeek-OCR
DeepSeek R1 (0528)
DeepSeek-V3.1
gpt-oss 120B
gpt-oss 20B
Kimi K2 思考
Llama 3.1 70B(预览版)
Llama 3.1 8B(预览版)
Llama 3.2 90B(预览版)
Llama 3.3 70B(预览版)
Llama 3.1 405B
Llama 4 Maverick 17B-128E(预览版)
Llama 4 Scout 17B-16E(预览版)
MiniMax M2
Multilingual E5 Large
Multilingual E5 Small
Qwen3 235B
Qwen3 Coder
Qwen3-Next-80B Instruct
Qwen3-Next-80B Thinking

后续步骤