Gemini Embedding 2

Gemini Embedding 2 是 Google 的嵌入生成模型,非常适合复杂的检索和分析任务。

Gemini Embedding 2 接受多模态输入,以生成 3072 维向量。它接受图片、文本、文档、音频和视频输入,并将生成的向量在语义上映射到统一的语义空间中。这样,您就可以执行各种任务,例如根据文本说明搜索图片。

Gemini Embedding 2 引入了多项功能,可优化嵌入质量和灵活性:

  • 自定义任务说明: 通过指定任务说明(例如 task:code retrievaltask:search result),针对预期关系优化嵌入,并检索更准确的结果以实现特定目标。

  • 可调整的结果大小: 该模型默认生成 3072 维浮点向量。不过,您可以通过指定 output_dimensionality 参数来检索维度较小的输出。

  • 文档 OCR: 从文档输入中读取 OCR。

  • 音轨提取: 从视频输入中提取音轨,并将其与视频帧交错。

如需详细了解如何使用 Gemini Embedding 2,请参阅获取多模态嵌入

Agent Platform 中试用 (预览版)部署示例应用

注意:如需使用“部署示例应用”功能,您需要拥有一个启用了结算功能和 Agent Platform API 的 Google Cloud 项目。
模型 ID gemini-embedding-2
支持的输入和输出
  • 输入:
    文本图片音频视频PDF
  • 输出:
    嵌入内容
token 数量上限
  • 输入 token 数量上限:8,192
  • 输出 token 数量上限:不适用
序列长度上限

8,192 个 token

输出维度

最多 3,072 个(支持 MRL)

使用选项
如需了解详情,请参阅使用选项
技术规范
图片
  • 每个提示的图片数量上限: 6
  • 内嵌数据或通过控制台直接上传的每个文件的文件大小上限: 无限制
  • Google Cloud Storage 中每个文件的文件大小上限: 无限制
  • 每个提示的输出图片数量上限: 不适用
  • 支持的 MIME 类型:
    image/pngimage/jpegimage/webpimage/bmpimage/heicimage/heifimage/avif
文档
  • 每个提示的文件数量上限: 1
  • 每个文件的页数上限: 6
  • 每个文件的文件大小上限: 不适用
  • 支持的 MIME 类型:
    application/pdf
视频
  • 视频时长上限(包含音频): 80 秒
  • 视频时长上限(不含音频): 120 秒
  • 每个提示的视频数量上限: 1
  • 支持的 MIME 类型:
    video/mpegvideo/mp4
音频
  • 每个提示的音频长度上限: 180 秒
  • 每个提示的音频文件数量上限: 1
  • 支持的 MIME 类型:
    audio/mp3audio/wav
参数默认值
支持的区域

模型可用性

如需了解详情,请参阅部署和端点
知识截点日期 2025 年 11 月
版本
  • gemini-embedding-2
    • 发布阶段:正式版
    • 发布日期:2026 年 4 月 22 日
  • gemini-embedding-2-preview
    • 发布阶段:公开预览版
    • 发布日期:2026 年 3 月 10 日
安全控制
如需了解详情,请参阅安全控制
支持的语言 请参阅支持的语言
价格 请参阅价格