Gemini Embedding 2

Gemini Embedding 2 是 Google 的嵌入生成模型,非常適合用於複雜的擷取和分析工作。

Gemini Embedding 2 接受多模態輸入內容,可生成 3072 維度的向量。這項模型接受圖片、文字、文件、音訊和影片輸入內容,並將生成的向量語意對應至統一的語意空間。因此,您可以執行各種工作,例如根據文字說明搜尋圖片。

Gemini Embedding 2 推出多項功能,可提升嵌入品質和彈性:

  • 自訂工作指令:指定工作指令 (例如 task:code retrievaltask:search result) 可針對預期關係最佳化嵌入內容,並針對特定目標擷取更準確的結果。

  • 可調整的結果大小:模型預設會生成 3072 維度的浮點向量。不過,您可以指定 output_dimensionality 參數,擷取維度較小的輸出內容。

  • 文件 OCR:從文件輸入內容讀取 OCR。

  • 音軌擷取:從輸入的影片擷取音軌,並與影片影格交錯。

如要進一步瞭解如何使用 Gemini Embedding 2,請參閱「取得多模態嵌入」。

Agent Platform 中試用 (預覽版) 部署範例應用程式

注意:如要使用「Deploy example app」功能,您需要啟用帳單和 Agent Platform API 的 Google Cloud 專案。
模型 ID gemini-embedding-2
支援的輸入和輸出
  • 輸入內容:
    文字圖片音訊影片PDF
  • 輸出內容:
    嵌入
權杖限制
  • 輸入內容符記數量上限:8,192
  • 輸出內容符記數量上限:不適用
序列長度上限

8,192 個權杖

輸出尺寸

最多 3,072 個 (支援 MRL)

用量方案
詳情請參閱「消費選項」。
技術規格
圖片
  • 每個提示的圖片數量上限: 6
  • 透過控制台直接上傳或內嵌資料時,每個檔案的大小上限: 無限制
  • 從 Google Cloud Storage 上傳檔案時,每個檔案的大小上限: 沒有限制
  • 每個提示的輸出圖片數量上限: 不適用
  • 支援的 MIME 類型:
    image/pngimage/jpegimage/webpimage/bmpimage/heicimage/heifimage/avif
文件
  • 每個提示的檔案數量上限: 1
  • 每個檔案的頁數上限: 6
  • 每個檔案的大小上限: 不適用
  • 支援的 MIME 類型:
    application/pdf
影片
  • 影片長度上限 (含音訊): 80 秒
  • 影片長度上限 (不含音訊): 120 秒
  • 每個提示的影片數量上限: 1
  • 支援的 MIME 類型:
    video/mpegvideo/mp4
音訊
  • 每個提示的音訊長度上限: 180 秒
  • 每個提示的音訊檔案數量上限: 1
  • 支援的 MIME 類型:
    audio/mp3audio/wav
參數預設值
支援的地區

模型供應情形

詳情請參閱「部署作業和端點」。
知識截點日期 2025 年 11 月
版本
  • gemini-embedding-2
    • 推出階段:正式發行
    • 發布日期:2026 年 4 月 22 日
  • gemini-embedding-2-preview
    • 推出階段:公開測試
    • 發布日期:2026 年 3 月 10 日
安全性控管
詳情請參閱安全控管措施
支援的語言 請參閱「支援的語言」。
定價 請參閱「定價」。