Gemini Embedding 2 是 Google 的嵌入生成模型,非常適合用於複雜的擷取和分析工作。
Gemini Embedding 2 接受多模態輸入內容,可生成 3072 維度的向量。這項模型接受圖片、文字、文件、音訊和影片輸入內容,並將生成的向量語意對應至統一的語意空間。因此,您可以執行各種工作,例如根據文字說明搜尋圖片。
Gemini Embedding 2 推出多項功能,可提升嵌入品質和彈性:
自訂工作指令:指定工作指令 (例如
task:code retrieval或task:search result) 可針對預期關係最佳化嵌入內容,並針對特定目標擷取更準確的結果。可調整的結果大小:模型預設會生成 3072 維度的浮點向量。不過,您可以指定
output_dimensionality參數,擷取維度較小的輸出內容。文件 OCR:從文件輸入內容讀取 OCR。
音軌擷取:從輸入的影片擷取音軌,並與影片影格交錯。
如要進一步瞭解如何使用 Gemini Embedding 2,請參閱「取得多模態嵌入」。
在 Agent Platform 中試用 (預覽版) 部署範例應用程式
| 模型 ID | gemini-embedding-2 |
|
|---|---|---|
| 支援的輸入和輸出 |
|
|
| 權杖限制 |
|
|
| 序列長度上限 |
8,192 個權杖 |
|
| 輸出尺寸 |
最多 3,072 個 (支援 MRL) |
|
| 用量方案 |
|
|
| 詳情請參閱「消費選項」。 | ||
| 技術規格 | ||
| 圖片 |
|
|
| 文件 |
|
|
| 影片 |
|
|
| 音訊 |
|
|
| 參數預設值 |
|
|
| 支援的地區 | ||
|
模型供應情形 |
||
| 詳情請參閱「部署作業和端點」。 | ||
| 知識截點日期 | 2025 年 11 月 | |
| 版本 |
|
|
| 安全性控管 | ||
| 詳情請參閱安全控管措施。 | ||
| 支援的語言 | 請參閱「支援的語言」。 | |
| 定價 | 請參閱「定價」。 | |