Gemini エンベディング 2

Gemini Embedding 2 は、複雑な検索と分析のタスクに最適な Google のエンベディング生成モデルです。

Gemini Embedding 2 は、マルチモーダル入力を受け入れて 3,072 次元のベクトルを生成します。画像、テキスト、ドキュメント、音声、動画の入力を受け入れ、生成されたベクトルを統一されたセマンティック空間にセマンティック マッピングします。これにより、テキストの説明に基づいて画像を検索するなどのタスクを実行できます。

Gemini Embedding 2 には、エンベディングの品質と柔軟性を最適化するための新機能がいくつか導入されています。

  • カスタム タスクの説明: タスクの説明(task:code retrievaltask:search result など)を指定することで、目的の関係に合わせてエンベディングを最適化し、特定の目標に対してより正確な結果を取得できます。

  • 調整可能な結果サイズ: デフォルトでは、3, 072 次元の浮動小数点ベクトルが生成されます。output_dimensionality パラメータを指定すると、より小さい次元の出力を取得できます。

  • ドキュメント OCR: ドキュメント入力から OCR を読み取ります。

  • 音声トラックの抽出: 動画入力から音声トラックを抽出し、動画フレームとインターリーブします。

Agent Platformで試す (プレビュー)サンプルアプリをデプロイする

注: 「サンプルアプリをデプロイする」機能を使用するには、課金と Agent Platform API が有効になっている Google Cloud プロジェクトが必要です。
モデル ID gemini-embedding-2
サポートされている入出力
  • 入力:
    テキスト画像音声動画PDF
  • 出力:
    エンベディング
トークンの上限
  • 最大入力トークン: 8,192
  • 最大出力トークン: N/A
シーケンスの最大長

8,192 トークン

出力のサイズ

最大 3,072(MRL サポートあり)

使用オプション
詳細については、使用オプションをご覧ください。
技術仕様
画像検索
  • プロンプトあたりの最大画像数: 6
  • インライン データまたはコンソールから直接アップロードする場合のファイルあたりの最大ファイルサイズ: 上限なし
  • Google Cloud Storage からのファイルあたりの最大ファイルサイズ: 上限なし
  • プロンプトあたりの出力画像の最大数: N/A
  • サポートされている MIME タイプ:
    image/pngimage/jpeg
ドキュメント
  • プロンプトあたりの最大ファイル数: 1
  • ファイルあたりの最大ページ数: 6
  • ファイルあたりの最大ファイルサイズ: N/A
  • サポートされている MIME タイプ:
    application/pdf
動画
  • 動画の長さの上限(音声あり): 80 秒
  • 動画の長さの上限(音声なし): 120 秒
  • プロンプトあたりの動画の最大数: 1
  • サポートされている MIME タイプ:
    video/mpegvideo/mp4
音声
  • プロンプトあたりの音声の最大長: 180 秒
  • プロンプトあたりの音声ファイルの最大数: 1
  • サポートされている MIME タイプ:
    audio/mp3audio/wav
パラメータのデフォルト
サポートされるリージョン

モデルの提供

  • グローバル
    • global
  • 米国(マルチリージョン)
    • us
  • ヨーロッパ(マルチリージョン)
    • eu
詳細については、デプロイとエンドポイントをご覧ください。
ナレッジ カットオフ日 2025 年 11 月
バージョン
  • gemini-embedding-2
    • リリース ステージ: GA
    • リリース日: 2026 年 4 月 22 日
  • gemini-embedding-2-preview
    • リリース ステージ: 公開プレビュー版
    • リリース日: 2026 年 3 月 10 日
セキュリティ管理
詳細については、セキュリティ管理をご覧ください。
サポートされている言語 サポートされている言語をご覧ください。
料金 料金をご覧ください。