Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Gemini Embedding 2

Gemini Embedding 2 是 Google 的嵌入生成模型，非常适合复杂的检索和分析任务。

Gemini Embedding 2 接受多模态输入，以生成 3072 维向量。它接受图片、文本、文档、音频和视频输入，并将生成的向量在语义上映射到统一的语义空间中。这样，您就可以执行各种任务，例如根据文本说明搜索图片。

Gemini Embedding 2 引入了多项功能，可优化嵌入质量和灵活性：

自定义任务说明：通过指定任务说明（例如 task:code retrieval 或 task:search result），针对预期关系优化嵌入，并检索更准确的结果以实现特定目标。
可调整的结果大小：该模型默认生成 3072 维浮点向量。不过，您可以通过指定 output_dimensionality 参数来检索维度较小的输出。
文档 OCR：从文档输入中读取 OCR。
音轨提取：从视频输入中提取音轨，并将其与视频帧交错。

如需详细了解如何使用 Gemini Embedding 2，请参阅获取多模态嵌入。

注意：如需使用“部署示例应用”功能，您需要拥有一个启用了结算功能和 Agent Platform API 的 Google Cloud 项目。

技术规范
模型 ID	`gemini-embedding-2`
支持的输入和输出	输入：文本、图片、音频、视频、 PDF 输出：嵌入内容
token 数量上限	输入 token 数量上限：8,192 输出 token 数量上限：不适用
序列长度上限	8,192 个 token
输出维度	最多 3,072 个（支持 MRL）
使用选项	支持 Standard 按需付费不支持预配吞吐量弹性按需付费优先级按需付费批量预测
使用选项	如需了解详情，请参阅使用选项。
	图片	每个提示的图片数量上限： 6 内嵌数据或通过控制台直接上传的每个文件的文件大小上限：无限制 Google Cloud Storage 中每个文件的文件大小上限：无限制每个提示的输出图片数量上限：不适用支持的 MIME 类型： `image/png`、 `image/jpeg`、 `image/webp`、 `image/bmp`、 `image/heic`、 `image/heif`、 `image/avif`
	文档	每个提示的文件数量上限： 1 每个文件的页数上限： 6 每个文件的文件大小上限：不适用支持的 MIME 类型： `application/pdf`
	视频	视频时长上限（包含音频）： 80 秒视频时长上限（不含音频）： 120 秒每个提示的视频数量上限： 1 支持的 MIME 类型： `video/mpeg`、 `video/mp4`
	音频	每个提示的音频长度上限： 180 秒每个提示的音频文件数量上限： 1 支持的 MIME 类型： `audio/mp3`、 `audio/wav`
	参数默认值
支持的区域
	模型可用性	全球全局美国多区域（请参阅连接指南） us 欧洲多区域（请参阅连接指南） eu
	如需了解详情，请参阅部署和端点。
知识截点日期	2025 年 11 月
版本	`gemini-embedding-2` 发布阶段：正式版发布日期：2026 年 4 月 22 日 `gemini-embedding-2-preview` 发布阶段：公开预览版发布日期：2026 年 3 月 10 日
安全控制
安全控制	如需了解详情，请参阅安全控制。
支持的语言	请参阅支持的语言。
价格	请参阅价格。

Gemini Embedding 2 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

Gemini Embedding 2