Google 模型

精选 Gemini 模型

已正式推出的 Gemini 模型

diamond Gemini 2.5 Pro 我们用于复杂推理和编码的高性能模型。具有自适应思考能力,可利用 100 万 token 上下文解决复杂的代理和多模态难题。
spark Gemini 2.5 Flash 速度极快且功能强大。通过可控的思考预算,为多用途应用提供智能与延迟的平衡。
🍌 Gemini 2.5 Flash Image 将创意转化为可用于生产的资产。具有对话式编辑、多图融合和角色一致性功能,适用于高级创意工作流。
performance_auto Gemini 2.5 Flash-Lite 专为大规模应用而打造。针对高吞吐量任务平衡了费用和性能,在不牺牲多模态理解能力的情况下优化了效率。
spark Gemini 2.0 Flash 为需要针对通用任务的高性价比模型的开发者提供多模态性能。
performance_auto Gemini 2.0 Flash-Lite 精简且超高效,适用于速度和价格优先的简单、高频任务。

预览 Gemini 模型

预览版 Gemini 3 Pro 我们最新的推理优先模型,针对复杂的代理工作流和编码进行了优化。具有自适应思考、100 万 token 上下文窗口以及集成式接地功能,用于解决复杂的多模态问题。
预览版 Gemini 3 Pro Image 具有推理增强构图功能的高保真图片生成。支持清晰的文本渲染、复杂的多轮编辑,以及使用多达 14 个参考输入来实现角色一致性。
预览版 Gemini 2.5 Flash Live API 专为实时双向流式传输而设计。具有低延迟的内置音频和共情对话功能,可实现自然的对话式交互。

Gemma 模型

Gemma 3n 一种开放模型,专为在低资源设备上高效执行而设计,支持多模态输入(文本、图片、视频和音频)以及 140 多种语言的文本输出。
Gemma 3 一种具备文本和图片输入功能、支持 140 多种语言并拥有 128K 上下文窗口的开放模型。
Gemma 2 一种支持文本生成、总结和提取的开放模型。
Gemma 一种支持文本生成、总结和提取的小型轻量级开放模型。
ShieldGemma 2 经过指令调优的模型,用于根据定义的政策评估文本和图片安全性。
PaliGemma 一种结合了 SigLIP 和 Gemma 的开放视觉语言模型。
CodeGemma 一种功能强大且轻量级的开放模型,用于编码任务,包括代码补全、生成和理解。
TxGemma 一种基于治疗相关数据生成预测、分类或文本的模型,用于以更少的数据和计算资源构建 AI 模型。
MedGemma Gemma 3 变体的集合,针对医学文本和图片理解的性能进行了训练。
MedSigLIP SigLIP 的一种变体,经过训练可将医学图片和文本编码到公共嵌入空间中。
T5Gemma 一个轻量级编码器-解码器研究模型系列。

嵌入模型

width_normal Embeddings for Text 将文本数据转换为向量表示法,用于语义搜索、分类和聚类。
width_normal Multimodal Embeddings 基于图片生成向量,用于图片分类和搜索等任务。

Imagen 模型

photo_spark Imagen 4 for Generation 使用文本提示生成新颖的图片,质量比我们之前的图片生成模型更高
photo_spark Imagen 4 for Fast Generation 使用文本提示生成新颖的图片,质量比我们之前的图片生成模型更高,延迟更低
photo_spark Imagen 4 for Ultra Generation 使用文本提示生成新颖的图片,质量比我们之前的图片生成模型更高,提示遵循度更好
photo_spark Imagen 3 for Generation 002 使用文本提示生成新颖的图片
photo_spark Imagen 3 for Generation 001 使用文本提示生成新颖的图片
photo_spark Imagen 3 for Fast Generation 使用文本提示生成新颖的图片,延迟比我们其他的图片生成模型更低
image_edit_auto Imagen 3 for Editing and Customization 根据文本提示和提供的上下文信息修改现有图片或生成新图片。

预览版 Imagen 模型

photo_spark 虚拟试穿 生成穿着服装产品的人物图片。
image_edit_auto Imagen Product Recontext on Vertex AI 根据文本提示修改产品图片,将其放置在不同的场景或背景中。

Veo 模型

movie Veo 2 Generate 根据文本提示和图片生成视频。
movie Veo 3 Generate 根据文本提示和图片生成高质量视频。
movie Veo 3 Fast 根据文本提示和图片生成高质量、低延迟的视频。
movie Veo 3.1 Generate 根据文本提示和图片生成高质量视频。
movie Veo 3.1 Fast 根据文本提示和图片生成高质量、低延迟的视频。

预览版 Veo 模型

movie Veo 3 Generate 预览版 根据文本提示和图片生成高质量视频。
movie Veo 3 Fast 预览版 根据文本提示和图片生成高质量、低延迟的视频。
movie Veo 3.1 Generate 预览版 根据文本提示和图片生成高质量视频。
movie Veo 3.1 Fast 预览版 根据文本提示和图片生成高质量、低延迟的视频。
movie Veo 2 预览版 根据文本提示和图片生成视频,支持修复和扩绘。

实验性 Veo 模型

movie Veo 2 实验版 一个实验性模型,具有正在测试的功能。

MedLM 模型

medical_information MedLM-medium 一种符合 HIPAA 标准的模型,用于回答医学问题和总结医疗保健文档。
clinical_notes MedLM-large-large 一种符合 HIPAA 标准的模型,用于回答医学问题和总结医疗保健文档。

语言支持

Gemini

所有 Gemini 模型都可以理解并以以下语言提供回答:

南非荷兰语 (af)、 阿尔巴尼亚语 (sq)、 阿姆哈拉语 (am)、 阿拉伯语 (ar)、 亚美尼亚语 (hy)、 阿萨姆语 (as)、 阿塞拜疆语 (az)、 巴斯克语 (eu)、 白俄罗斯语 (be)、 孟加拉语 (bn)、 波斯尼亚语 (bs)、 保加利亚语 (bg)、 加泰罗尼亚语 (ca)、 宿务语 (ceb)、 中文(简体和繁体)(zh)、 科西嘉语 (co)、 克罗地亚语 (hr)、 捷克语 (cs)、 丹麦语 (da)、 迪维希语 (dv)、 荷兰语 (nl)、 英语 (en)、 世界语 (eo)、 爱沙尼亚语 (et)、 菲律宾语(他加禄语)(fil)、 芬兰语 (fi)、 法语 (fr)、 弗里斯兰语 (fy)、 加利西亚语 (gl)、 格鲁吉亚语 (ka)、 德语 (de)、 希腊语 (el)、 古吉拉特语 (gu)、 海地克里奥尔语 (ht)、 豪萨语 (ha)、 夏威夷语 (haw)、 希伯来语 (iw)、 印地语 (hi)、 苗语 (hmn)、 匈牙利语 (hu)、 冰岛语 (is)、 伊博语 (ig)、 印度尼西亚语 (id)、 爱尔兰语 (ga)、 意大利语 (it)、 日语 (ja)、 爪哇语 (jv)、 卡纳达语 (kn)、 哈萨克语 (kk)、 高棉语 (km)、 韩语 (ko)、 克里奥语 (kri)、 库尔德语 (ku)、 吉尔吉斯语 (ky)、 老挝语 (lo)、 拉丁语 (la)、 拉脱维亚语 (lv)、 立陶宛语 (lt)、 卢森堡语 (lb)、 马其顿语 (mk)、 马达加斯加语 (mg)、 马来语 (ms)、 马拉雅拉姆语 (ml)、 马耳他语 (mt)、 毛利语 (mi)、 马拉地语 (mr)、 梅泰语(曼尼普尔语)(mni-Mtei)、 蒙古语 (mn)、 缅甸语 (my)、 尼泊尔语 (ne)、 挪威语 (no)、 尼扬加语(齐切瓦语)(ny)、 奥迪亚语(奥里亚语)(or)、 普什图语 (ps)、 波斯语 (fa)、 波兰语 (pl)、 葡萄牙语 (pt)、 旁遮普语 (pa)、 罗马尼亚语 (ro)、 俄语 (ru)、 萨摩亚语 (sm)、 苏格兰盖尔语 (gd)、 塞尔维亚语 (sr)、 塞索托语 (st)、 绍纳语 (sn)、 信德语 (sd)、 僧伽罗语(锡兰语)(si)、 斯洛伐克语 (sk)、 斯洛文尼亚语 (sl)、 索马里语 (so)、 西班牙语 (es)、 巽他语 (su)、 斯瓦希里语 (sw)、 瑞典语 (sv)、 塔吉克语 (tg)、 泰米尔语 (ta)、 泰卢固语 (te)、 泰语 (th)、 土耳其语 (tr)、 乌克兰语 (uk)、 乌尔都语 (ur)、 维吾尔语 (ug)、 乌兹别克语 (uz)、 越南语 (vi)、 威尔士语 (cy)、 科萨语 (xh)、 意第绪语 (yi)、 约鲁巴语 (yo) 和祖鲁语 (zu)。

Gemma

Gemma 和 Gemma 2 仅支持英语 (en)。Gemma 3 和 Gemma 3n 支持 140 多种语言。

Embeddings

多语言文本嵌入模型支持以下语言:

南非荷兰语 (af)、 阿尔巴尼亚语 (sq)、 阿姆哈拉语 (am)、 阿拉伯语 (ar)、 亚美尼亚语 (hy)、 阿塞拜疆语 (az)、 巴斯克语 (eu)、 白俄罗斯语 (be)、 孟加拉语 (bn)、 保加利亚语 (bg)、 加泰罗尼亚语 (ca)、 宿务语 (ceb)、 中文(简体和繁体)(zh)、 科西嘉语 (co)、 捷克语 (cs)、 丹麦语 (da)、 荷兰语 (nl)、 英语 (en)、 世界语 (eo)、 爱沙尼亚语 (et)、 菲律宾语(他加禄语)(fil)、 芬兰语 (fi)、 法语 (fr)、 弗里斯兰语 (fy)、 加利西亚语 (gl)、 格鲁吉亚语 (ka)、 德语 (de)、 希腊语 (el)、 古吉拉特语 (gu)、 海地克里奥尔语 (ht)、 豪萨语 (ha)、 夏威夷语 (haw)、 希伯来语 (iw)、 印地语 (hi)、 苗语 (hmn)、 匈牙利语 (hu)、 冰岛语 (is)、 伊博语 (ig)、 印度尼西亚语 (id)、 爱尔兰语 (ga)、 意大利语 (it)、 日语 (ja)、 爪哇语 (jv)、 卡纳达语 (kn)、 哈萨克语 (kk)、 高棉语 (km)、 韩语 (ko)、 库尔德语 (ku)、 吉尔吉斯语 (ky)、 老挝语 (lo)、 拉丁语 (la)、 拉脱维亚语 (lv)、 立陶宛语 (lt)、 卢森堡语 (lb)、 马其顿语 (mk)、 马达加斯加语 (mg)、 马来语 (ms)、 马拉雅拉姆语 (ml)、 马耳他语 (mt)、 毛利语 (mi)、 马拉地语 (mr)、 蒙古语 (mn)、 缅甸语 (my)、 尼泊尔语 (ne)、 尼扬加语(齐切瓦语)(ny)、 挪威语 (no)、 普什图语 (ps)、 波斯语 (fa)、 波兰语 (pl)、 葡萄牙语 (pt)、 旁遮普语 (pa)、 罗马尼亚语 (ro)、 俄语 (ru)、 萨摩亚语 (sm)、 苏格兰盖尔语 (gd)、 塞尔维亚语 (sr)、 塞索托语 (st)、 绍纳语 (sn)、 信德语 (sd)、 僧伽罗语(锡兰语)(si)、 斯洛伐克语 (sk)、 斯洛文尼亚语 (sl)、 索马里语 (so)、 西班牙语 (es)、 巽他语 (su)、 斯瓦希里语 (sw)、 瑞典语 (sv)、 塔吉克语 (tg)、 泰米尔语 (ta)、 泰卢固语 (te)、 泰语 (th)、 土耳其语 (tr)、 乌克兰语 (uk)、 乌尔都语 (ur)、 乌兹别克语 (uz)、 越南语 (vi)、 威尔士语 (cy)、 科萨语 (xh)、 意第绪语 (yi)、 约鲁巴语 (yo) 和祖鲁语 (zu)。

Imagen 3

Imagen 3 支持以下语言:

英语 (en)、 中文(简体和繁体)(zh)、 印地语 (hi)、 日语 (ja)、 韩语 (ko)、 葡萄牙语 (pt) 和西班牙语 (es)。

MedLM

MedLM 模型支持英语 (en)。

在 Model Garden 中探索所有模型

Model Garden 是一个平台,可帮助您发现、测试、自定义和部署 Google 专有的以及部分 OSS 模型和资产。如需探索 Vertex AI 上可用的生成式 AI 模型和 API,请前往 Google Cloud 控制台中的 Model Garden。

转到 Model Garden

如需详细了解 Model Garden,包括可用的模型和功能,请参阅在 Model Garden 中探索 AI 模型

模型版本

如需查看所有模型版本(包括旧版模型和已弃用的模型),请参阅模型版本和生命周期

后续步骤