Gemini 3 Flash

Gemini 3 Flash 兼具 Gemini 3 Pro 的推理能力和 Flash 系列在延迟时间、效率和成本方面的优势。它不仅能通过改进的推理能力来处理日常任务，还旨在应对最复杂的代理工作流。

Gemini 3 Flash 采用多项新功能，以提高性能、可控性和多模态保真度：

思考级别：使用 thinking_level 参数控制模型执行的内部推理量（最低、低、中或高），以平衡回答质量、推理复杂性、延迟时间和费用。对于 Gemini 3 模型，thinking_level 参数取代了 thinking_budget。

注意：如果您之前使用 Gemini 2.5 Flash 时将思考预算设置为 0，则可以将思考级别设置为 MINIMAL，以获得类似的延迟时间和费用；不过，在使用最低思考级别时，您仍然需要处理思考签名。

如需详细了解不同的思考级别，请参阅思考。
思考签名：对思考签名进行更严格的验证，可提高多轮函数调用的可靠性。
媒体分辨率：使用 media_resolution 参数（低、中、高或超高）控制多模态输入的视觉处理，从而影响 token 用量和延迟时间。如需了解默认分辨率设置，请参阅 Gemini 3 使用入门。
- 超高媒体分辨率级别仅适用于 IMAGE 模态。
- 在 usage_metadata 中，PDF token 计数将列在 IMAGE 模态下，而不是 DOCUMENT 模态下。
多模态函数响应：除了文本之外，函数响应现在还可以包含图片和 PDF 等多模态对象。
流式函数调用：流式传输部分函数调用参数，以改善工具使用过程中的用户体验。

如需详细了解如何使用这些功能，请参阅 Gemini 3 使用入门。

在 Vertex AI 中试用在 Model Garden 中查看（预览版）部署示例应用

注意：如需使用“部署示例应用”功能，您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。

技术规范
模型 ID	`gemini-3-flash-preview`
支持的输入和输出	输入：文本、代码、图片、音频、视频 PDF 输出：文本
token 数量上限	输入词元数上限：1,048,576 输出 token 数量上限：65,536
功能	支持使用 Google 搜索建立依据代码执行系统指令结构化输出函数调用统计 token 数量思考型隐式上下文缓存显式上下文缓存 Vertex AI RAG 引擎聊天补全不支持调优 Gemini Live API
使用类型	支持预配吞吐量动态共享配额批量预测不支持固定配额
	图片	每个提示的图片数量上限： 900 内嵌数据或通过控制台直接上传的每个文件的文件大小上限： 7 MB Google Cloud Storage 中每个文件的文件大小上限： 30 MB 默认分辨率 token 数： 1120 支持的 MIME 类型： `image/png`、`image/jpeg`、`image/webp`、`image/heic`、`image/heif`
	文档	每个提示的文件数量上限： 900 每个文件的页数上限： 900 通过 API 或 Cloud Storage 导入时，每个文件的文件大小上限：50 MB 通过控制台直接上传的每个文件的文件大小上限：7 MB 默认分辨率 token 数： 560 适用于扫描版 PDF 的 OCR：默认不使用支持的 MIME 类型： `application/pdf`、 `text/plain`
	视频	视频时长上限（包含音频）：约 45 分钟视频时长上限（不含音频）：约 1 小时每个提示的视频数量上限：10 每帧的默认分辨率 token 数： 70 支持的 MIME 类型： `video/x-flv`、`video/quicktime`、`video/mpeg`、`video/mpegs`、`video/mpg`、`video/mp4`、`video/webm`、`video/wmv`、`video/3gpp`
	音频	每个提示的音频长度上限：约 8.4 小时或最多 100 万个 token 每个提示的音频文件数量上限： 1 语音理解，用于：音频摘要、转写和翻译支持的 MIME 类型： `audio/x-aac`、`audio/flac`、`audio/mp3`、`audio/m4a`、`audio/mpeg`、`audio/mpga`、`audio/mp4`、`audio/ogg`、`audio/pcm`、`audio/wav`、`audio/webm`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性（包括动态共享配额和预配吞吐量）	全球全局
	如需了解详情，请参阅部署和端点。
知识截点日期	2025 年 1 月
版本	`gemini-3-flash-preview` 发布阶段：公开预览版发布日期：2025 年 12 月 17 日
安全控制
安全控制	如需了解详情，请参阅安全控制。
支持的语言	请参阅支持的语言。
价格	请参阅价格。

Gemini 3 Flash 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

Gemini 3 Flash