Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Google 模型

精选 Gemini 模型

3.5 Flash

旨在以极快的速度和极高的价值提供强大的智能体功能（接近专业级）。

专业级编码能力和并行智能体执行
具有 100 万个 token 的上下文窗口
以 Flash 级成本和速度提供接近 Pro 级的智能

3.1 Pro

专为全面的多模态理解和复杂问题解决而设计

具有 100 万个 token 的上下文窗口
在代理工作流和自主编码任务方面的性能有所提升
专为复杂的多模态任务和高级推理而设计

3 Flash

我们最强大的智能体和编码模型，具有出色的多模态理解能力

我们 Gemini 主力模型系列的最新成员
增强的多模态和编码功能
新增了近乎零思考等级选项

3.1 Flash-Lite

我们最具成本效益的一款模型，经过优化，适合要求延迟时间较短的使用场景，可处理大体量的成本敏感型 LLM 流量

针对低延迟和大流量进行了优化
提升了回答质量和指令遵循能力
改进了 ASR 任务的音频输入质量

2.5 Flash Image

借助图片生成和对话式编辑，快速启动创意工作流

生成高质量图片
支持基于轮次的对话式编辑
拥有与 Gemini 2.5 Flash 相同的速度与价格平衡

已正式推出的 Gemini 模型

spark Gemini 3.5 Flash Gemini 3.5 Flash 以 Flash 级成本和速度提供接近 Pro 级的智能：Pro 级编码能力、并行智能体执行，所有这些都以 Flash 模型的相同价格提供。

performance_auto Gemini 3.1 Flash-Lite 我们最具成本效益的模型，针对低延迟用例进行了优化，适用于大体量的成本敏感型 LLM 流量。

diamond Gemini 2.5 Pro 我们用于复杂推理和编码的高性能模型。具有自适应思考能力，可利用 100 万 token 上下文解决复杂的代理和多模态难题。

spark Gemini 2.5 Flash 速度极快且功能强大。通过可控的思考预算，为多用途应用提供智能与延迟的平衡。

🍌 Gemini 2.5 Flash Image 将创意转化为可用于生产用途的资产。具有对话式智能修图、多图融合和角色一致性功能，适用于高级创意工作流。

performance_auto Gemini 2.5 Flash-Lite 专为大规模应用而打造。针对高吞吐量任务平衡了费用和性能，在不牺牲多模态理解能力的情况下优化了效率。

audio_spark Gemini 2.5 Flash（支持 Gemini Live API）专为实时双向流式传输而设计。具有低延迟的内置音频和共情对话功能，可实现自然的对话式交互。

spark Gemini 2.0 Flash 为需要针对通用任务的高性价比模型的开发者提供多模态性能。

performance_auto Gemini 2.0 Flash-Lite 精简且超高效，适用于速度和价格优先的简单、高频任务。

预览 Gemini 模型

预览版 Gemini 3.1 Flash Image 将创意转化为可用于生产用途的资产。具有对话式智能修图、多图融合和角色一致性功能，适用于高级创意工作流。

预览版 Gemini 3.1 Pro 我们最新的推理优先模型，针对复杂的代理工作流和编码进行了优化。具有自适应思考、100 万 token 上下文窗口以及集成式接地功能，用于解决复杂的多模态问题。

预览版 Gemini 3 Flash 我们最擅长复杂多模态理解的模型，旨在通过强大的编码和先进的推理能力解决最具挑战性的代理问题。

预览版 Gemini 3 Pro Image 具有推理增强构图功能的高保真图片生成。支持清晰的文本渲染、复杂的多轮编辑，以及使用多达 14 个参考输入来实现角色一致性。

Gemma 模型

Gemma 4 一种开放模型，非常适合文本生成、编码和推理等任务，支持多模态输入（所有变体支持文本和图片输入，E2B 和 E4B 变体还支持音频输入）。

Gemma 3n 一种开放模型，专为在低资源设备上高效执行而设计，支持多模态输入（文本、图片、视频和音频）以及 140 多种语言的文本输出。

Gemma 3 一种具备文本和图片输入功能、支持 140 多种语言并拥有 128K 上下文窗口的开放模型。

Gemma 2 一种支持文本生成、总结和提取的开放模型。

Gemma 一种支持文本生成、总结和提取的小型轻量级开放模型。

ShieldGemma 2 经过指令调优的模型，用于根据定义的政策评估文本和图片安全性。

PaliGemma 一种结合了 SigLIP 和 Gemma 的开放视觉语言模型。

CodeGemma 一种功能强大且轻量级的开放模型，用于编码任务，包括代码补全、生成和理解。

TxGemma 一种基于治疗相关数据生成预测、分类或文本的模型，用于以更少的数据和计算资源构建 AI 模型。

MedGemma Gemma 3 变体的集合，针对医学文本和图片理解的性能进行了训练。

MedSigLIP SigLIP 的一种变体，经过训练可将医学图片和文本编码到公共嵌入空间中。

T5Gemma 一个轻量级编码器-解码器研究模型系列。

嵌入模型

width_normal Embeddings for Text 将文本数据转换为向量表示法，用于语义搜索、分类和聚类。

width_normal Multimodal Embeddings 基于图片生成向量，用于图片分类和搜索等任务。

Veo 模型

movie Veo 2 Generate 根据文本提示和图片生成视频。

movie Veo 3 Generate 根据文本提示和图片生成高质量视频。

movie Veo 3 Fast 根据文本提示和图片生成高质量、低延迟的视频。

movie Veo 3.1 Generate 根据文本提示和图片生成高质量视频。

movie Veo 3.1 Fast 根据文本提示和图片生成高质量、低延迟的视频。

预览版 Veo 模型

movie Veo 3.1 Lite 预览版根据文本提示和图片生成高质量、低成本的视频。

movie Veo 3 Generate 预览版根据文本提示和图片生成高质量视频。

movie Veo 3 Fast 预览版根据文本提示和图片生成高质量、低延迟的视频。

movie Veo 3.1 Generate 预览版根据文本提示和图片生成高质量视频。

movie Veo 3.1 Fast 预览版根据文本提示和图片生成高质量、低延迟的视频。

movie Veo 2 预览版根据文本提示和图片生成视频，支持修复和扩绘。

实验性 Veo 模型

movie Veo 2 实验版一个实验性模型，具有正在测试的功能。

Lyria 模型

music_note_spark Lyria 3 Pro（预览版）根据文本和图片提示生成完整长度的音乐曲目。

music_note_spark Lyria 3 Clip（预览版）根据文本和图片提示生成 30 秒的音频片段。

audio_spark Lyria 2 根据文本提示生成音乐。

语言支持

Gemini

所有 Gemini 模型都可以理解并以以下语言提供回答：

南非荷兰语 (af)、阿尔巴尼亚语 (sq)、阿姆哈拉语 (am)、阿拉伯语 (ar)、亚美尼亚语 (hy)、阿萨姆语 (as)、阿塞拜疆语 (az)、巴斯克语 (eu)、白俄罗斯语 (be)、孟加拉语 (bn)、波斯尼亚语 (bs)、保加利亚语 (bg)、加泰罗尼亚语 (ca)、宿务语 (ceb)、中文（简体和繁体）(zh)、科西嘉语 (co)、克罗地亚语 (hr)、捷克语 (cs)、丹麦语 (da)、迪维希语 (dv)、荷兰语 (nl)、英语 (en)、世界语 (eo)、爱沙尼亚语 (et)、菲律宾语（他加禄语）(fil)、芬兰语 (fi)、法语 (fr)、弗里斯兰语 (fy)、加利西亚语 (gl)、格鲁吉亚语 (ka)、德语 (de)、希腊语 (el)、古吉拉特语 (gu)、海地克里奥尔语 (ht)、豪萨语 (ha)、夏威夷语 (haw)、希伯来语 (iw)、印地语 (hi)、苗语 (hmn)、匈牙利语 (hu)、冰岛语 (is)、伊博语 (ig)、印度尼西亚语 (id)、爱尔兰语 (ga)、意大利语 (it)、日语 (ja)、爪哇语 (jv)、卡纳达语 (kn)、哈萨克语 (kk)、高棉语 (km)、韩语 (ko)、克里奥语 (kri)、库尔德语 (ku)、吉尔吉斯语 (ky)、老挝语 (lo)、拉丁语 (la)、拉脱维亚语 (lv)、立陶宛语 (lt)、卢森堡语 (lb)、马其顿语 (mk)、马达加斯加语 (mg)、马来语 (ms)、马拉雅拉姆语 (ml)、马耳他语 (mt)、毛利语 (mi)、马拉地语 (mr)、梅泰语（曼尼普尔语）(mni-Mtei)、蒙古语 (mn)、缅甸语 (my)、尼泊尔语 (ne)、挪威语 (no)、尼扬加语（齐切瓦语）(ny)、奥迪亚语（奥里亚语）(or)、普什图语 (ps)、波斯语 (fa)、波兰语 (pl)、葡萄牙语 (pt)、旁遮普语 (pa)、罗马尼亚语 (ro)、俄语 (ru)、萨摩亚语 (sm)、苏格兰盖尔语 (gd)、塞尔维亚语 (sr)、塞索托语 (st)、绍纳语 (sn)、信德语 (sd)、僧伽罗语（锡兰语）(si)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、索马里语 (so)、西班牙语 (es)、巽他语 (su)、斯瓦希里语 (sw)、瑞典语 (sv)、塔吉克语 (tg)、泰米尔语 (ta)、泰卢固语 (te)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、乌尔都语 (ur)、维吾尔语 (ug)、乌兹别克语 (uz)、越南语 (vi)、威尔士语 (cy)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo) 和祖鲁语 (zu)。

Gemma

Gemma 和 Gemma 2 仅支持英语 (en)。Gemma 3 和 Gemma 3n 支持 140 多种语言。

Embeddings

多语言文本嵌入模型支持以下语言：

南非荷兰语 (af)、阿尔巴尼亚语 (sq)、阿姆哈拉语 (am)、阿拉伯语 (ar)、亚美尼亚语 (hy)、阿塞拜疆语 (az)、巴斯克语 (eu)、白俄罗斯语 (be)、孟加拉语 (bn)、保加利亚语 (bg)、加泰罗尼亚语 (ca)、宿务语 (ceb)、中文（简体和繁体）(zh)、科西嘉语 (co)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、世界语 (eo)、爱沙尼亚语 (et)、菲律宾语（他加禄语）(fil)、芬兰语 (fi)、法语 (fr)、弗里斯兰语 (fy)、加利西亚语 (gl)、格鲁吉亚语 (ka)、德语 (de)、希腊语 (el)、古吉拉特语 (gu)、海地克里奥尔语 (ht)、豪萨语 (ha)、夏威夷语 (haw)、希伯来语 (iw)、印地语 (hi)、苗语 (hmn)、匈牙利语 (hu)、冰岛语 (is)、伊博语 (ig)、印度尼西亚语 (id)、爱尔兰语 (ga)、意大利语 (it)、日语 (ja)、爪哇语 (jv)、卡纳达语 (kn)、哈萨克语 (kk)、高棉语 (km)、韩语 (ko)、库尔德语 (ku)、吉尔吉斯语 (ky)、老挝语 (lo)、拉丁语 (la)、拉脱维亚语 (lv)、立陶宛语 (lt)、卢森堡语 (lb)、马其顿语 (mk)、马达加斯加语 (mg)、马来语 (ms)、马拉雅拉姆语 (ml)、马耳他语 (mt)、毛利语 (mi)、马拉地语 (mr)、蒙古语 (mn)、缅甸语 (my)、尼泊尔语 (ne)、尼扬加语（齐切瓦语）(ny)、挪威语 (no)、普什图语 (ps)、波斯语 (fa)、波兰语 (pl)、葡萄牙语 (pt)、旁遮普语 (pa)、罗马尼亚语 (ro)、俄语 (ru)、萨摩亚语 (sm)、苏格兰盖尔语 (gd)、塞尔维亚语 (sr)、塞索托语 (st)、绍纳语 (sn)、信德语 (sd)、僧伽罗语（锡兰语）(si)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、索马里语 (so)、西班牙语 (es)、巽他语 (su)、斯瓦希里语 (sw)、瑞典语 (sv)、塔吉克语 (tg)、泰米尔语 (ta)、泰卢固语 (te)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、乌尔都语 (ur)、乌兹别克语 (uz)、越南语 (vi)、威尔士语 (cy)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo) 和祖鲁语 (zu)。

在 Model Garden 中探索所有模型

Model Garden 是一个平台，可帮助您发现、测试、自定义和部署 Google 专有的以及部分 OSS 模型和资产。如需探索 Gemini Enterprise Agent Platform 上可用的生成式 AI 模型和 API，请前往 Google Cloud 控制台中的 Model Garden。

转到 Model Garden

如需详细了解 Model Garden，包括可用的模型和功能，请参阅在 Model Garden 中探索 AI 模型。

模型版本

如需查看所有模型版本（包括旧版模型和已弃用的模型），请参阅模型版本和生命周期。

后续步骤

探索 Model Garden 中的预训练模型。
了解如何使用 Model Garden 组织政策控制对 Model Garden 中特定模型的访问权限。
了解价格。

Google 模型 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。