Gemini Embedding 2 は、複雑な検索タスクや分析タスクに最適な Google のエンベディング生成モデルです。
Gemini Embedding 2 は、マルチモーダル入力を受け入れて 3,072 次元のベクトルを生成します。画像、テキスト、ドキュメント、音声、動画の入力を受け入れ、生成されたベクトルを統一されたセマンティック空間にセマンティックにマッピングします。これにより、テキストの説明に基づいて画像を検索するなどのタスクを実行できます。
Gemini Embedding 2 には、エンベディングの品質と柔軟性を最適化するための新機能がいくつか導入されています。
カスタム タスクの指示: タスクの指示(
task:code retrievalやtask:search resultなど)を指定することで、目的の関係に合わせてエンベディングを最適化し、特定の目標に対してより正確な結果を取得できます。調整可能な結果サイズ: モデルは、デフォルトで 3,072 次元の浮動小数点ベクトルを生成します。ただし、
output_dimensionalityパラメータを指定することで、より小さな次元の出力を取得できます。ドキュメント OCR: ドキュメント入力から OCR を読み取ります。
音声トラックの抽出: 動画入力から音声トラックを抽出し、動画フレームとインターリーブします。
Gemini Embedding 2 の使用方法の詳細については、マルチモーダル エンベディングを取得するをご覧ください。
Agent Platform で試す (プレビュー)サンプルアプリをデプロイする
| モデル ID | gemini-embedding-2 |
|
|---|---|---|
| サポートされている入出力 |
|
|
| トークンの上限 |
|
|
| シーケンスの最大長 |
8,192 個のトークン |
|
| 出力のサイズ |
最大 3,072(MRL サポートあり) |
|
| 使用オプション |
|
|
| 詳細については、消費オプションをご覧ください。 | ||
| 技術仕様 | ||
| 画像 |
|
|
| ドキュメント |
|
|
| 動画 |
|
|
| 音声 |
|
|
| パラメータのデフォルト |
|
|
| サポートされるリージョン | ||
|
モデルの提供 |
||
| 詳細については、デプロイとエンドポイントをご覧ください。 | ||
| ナレッジ カットオフ日 | 2025 年 11 月 | |
| バージョン |
|
|
| セキュリティ管理 | ||
| 詳細については、セキュリティ管理をご覧ください。 | ||
| サポートされている言語 | サポートされている言語をご覧ください。 | |
| 料金 | 料金をご覧ください。 | |