Gemini 3 Pro

Gemini 3 Pro 是我们推理能力最强的 Gemini 模型,能够解决复杂问题。Gemini 3 Pro 能够利用其 100 万 token 的上下文窗口,理解来自不同信息来源(包括文本、音频、图片、视频、PDF 甚至整个代码库)的海量数据集和复杂难题。

Gemini 3 Pro 引入了多项新功能,以提高性能、可控性和多模态保真度:

如需详细了解如何使用这些功能,请参阅 Gemini 3 Pro 使用入门

Vertex AI 中试用 Model Garden 中查看 (预览版)部署示例应用

注意:如需使用“部署示例应用”功能,您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。
模型 ID gemini-3-pro-preview
支持的输入和输出
  • 输入:
    文本代码图片音频视频 PDF
  • 输出:
    文本
token 数量上限
  • 输入词元数上限:1,048,576
  • 输出 token 数量上限:65,535
功能
使用类型
技术规范
图片
  • 每个提示的图片数量上限: 900
  • 图片大小上限: 7 MB
  • 默认分辨率 token 数: 1120
  • 支持的 MIME 类型:
    image/pngimage/jpegimage/webpimage/heicimage/heif
文档
  • 每个提示的文件数量上限: 900
  • 每个文件的页数上限: 900
  • 通过 API 或 Cloud Storage 导入时,每个文件的文件大小上限:50 MB
  • 通过控制台直接上传的每个文件的文件大小上限:7 MB
  • 默认分辨率 token 数: 560
  • 适用于扫描版 PDF 的 OCR: 默认不使用
  • 支持的 MIME 类型:
    application/pdftext/plain
视频
  • 视频时长上限(包含音频):约 45 分钟
  • 视频时长上限(不含音频):约 1 小时
  • 每个提示的视频数量上限:10
  • 每帧的默认分辨率 token 数: 70
  • 支持的 MIME 类型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音频
  • 每个提示的音频长度上限:约 8.4 小时或最多 100 万个 token
  • 每个提示的音频文件数量上限: 1
  • 语音理解,用于:音频摘要、转写和翻译
  • 支持的 MIME 类型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/oggaudio/pcmaudio/wavaudio/webm
参数默认值
  • 温度:0.0-2.0(默认值为 1.0)
  • topP:0.0-1.0(默认值为 0.95)
  • topK:64(固定值)
  • candidateCount:1-8(默认值为 1)
支持的区域

模型可用性

(包括动态共享配额和预配吞吐量)

  • 全球
    • 全局
如需了解详情,请参阅数据驻留
知识截点日期 2025 年 1 月
版本
  • gemini-3-pro-preview
    • 发布阶段:公开预览版
    • 发布日期:2025 年 11 月 18 日
安全控制
如需了解详情,请参阅安全控制
支持的语言 请参阅支持的语言
价格 请参阅价格