Gemini Embedding 2 是 Google 的嵌入生成模型,非常适合复杂的检索和分析任务。
Gemini Embedding 2 接受多模态输入,以生成 3072 维向量。它接受图片、文本、文档、音频和视频输入,并将生成的向量在语义上映射到统一的语义空间中。这样,您就可以执行各种任务,例如根据文本说明搜索图片。
Gemini Embedding 2 引入了多项功能,可优化嵌入质量和灵活性:
自定义任务说明: 通过指定任务说明(例如
task:code retrieval或task:search result),针对预期关系优化嵌入,并检索更准确的结果以实现特定目标。可调整的结果大小: 该模型默认生成 3072 维浮点向量。不过,您可以通过指定
output_dimensionality参数来检索维度较小的输出。文档 OCR: 从文档输入中读取 OCR。
音轨提取: 从视频输入中提取音轨,并将其与视频帧交错。
如需详细了解如何使用 Gemini Embedding 2,请参阅获取多模态嵌入。
在 Agent Platform 中试用 (预览版)部署示例应用
| 模型 ID | gemini-embedding-2 |
|
|---|---|---|
| 支持的输入和输出 |
|
|
| token 数量上限 |
|
|
| 序列长度上限 |
8,192 个 token |
|
| 输出维度 |
最多 3,072 个(支持 MRL) |
|
| 使用选项 |
|
|
| 如需了解详情,请参阅使用选项。 | ||
| 技术规范 | ||
| 图片 |
|
|
| 文档 |
|
|
| 视频 |
|
|
| 音频 |
|
|
| 参数默认值 |
|
|
| 支持的区域 | ||
|
模型可用性 |
||
| 如需了解详情,请参阅部署和端点。 | ||
| 知识截点日期 | 2025 年 11 月 | |
| 版本 |
|
|
| 安全控制 | ||
| 如需了解详情,请参阅安全控制。 | ||
| 支持的语言 | 请参阅支持的语言。 | |
| 价格 | 请参阅价格。 | |