Gemini 3 Flash 兼具 Gemini 3 Pro 的推理能力和 Flash 系列在延迟时间、效率和成本方面的优势。它不仅能通过改进的推理能力来处理日常任务,还旨在应对最复杂的代理工作流。
Gemini 3 Flash 采用多项新功能,以提高性能、可控性和多模态保真度:
思考级别:使用
thinking_level参数控制模型执行的内部推理量(最低、低、中或高),以平衡回答质量、推理复杂性、延迟时间和费用。对于 Gemini 3 模型,thinking_level参数取代了thinking_budget。如需详细了解不同的思考级别,请参阅思考。
思考签名:对思考签名进行更严格的验证,可提高多轮函数调用的可靠性。
媒体分辨率:使用
media_resolution参数(低、中、高或超高)控制多模态输入的视觉处理,从而影响 token 用量和延迟时间。如需了解默认分辨率设置,请参阅 Gemini 3 使用入门。- 超高媒体分辨率级别仅适用于
IMAGE模态。 - 在
usage_metadata中,PDF token 计数将列在IMAGE模态下,而不是DOCUMENT模态下。
- 超高媒体分辨率级别仅适用于
多模态函数响应:除了文本之外,函数响应现在还可以包含图片和 PDF 等多模态对象。
流式函数调用:流式传输部分函数调用参数,以改善工具使用过程中的用户体验。
如需详细了解如何使用这些功能,请参阅 Gemini 3 使用入门。
在 Vertex AI 中试用 在 Model Garden 中查看 (预览版)部署示例应用
| 模型 ID | gemini-3-flash-preview |
|
|---|---|---|
| 支持的输入和输出 |
|
|
| token 数量上限 |
|
|
| 功能 | ||
| 使用类型 | ||
| 技术规范 | ||
| 图片 |
|
|
| 文档 |
|
|
| 视频 |
|
|
| 音频 |
|
|
| 参数默认值 |
|
|
| 支持的区域 | ||
|
模型可用性 (包括动态共享配额和预配吞吐量) |
|
|
| 如需了解详情,请参阅部署和端点。 | ||
| 知识截点日期 | 2025 年 1 月 | |
| 版本 |
|
|
| 安全控制 | ||
| 如需了解详情,请参阅安全控制。 | ||
| 支持的语言 | 请参阅支持的语言。 | |
| 价格 | 请参阅价格。 | |