Gemini エンベディング 2

Gemini Embedding 2 は、複雑な検索と分析のタスクに最適な Google のエンベディング生成モデルです。

Gemini Embedding 2 は、マルチモーダル入力を受け入れて 3,072 次元のベクトルを生成します。画像、テキスト、ドキュメント、音声、動画の入力を受け入れ、生成されたベクトルを統一されたセマンティック空間にセマンティックマッピングします。これにより、テキストの説明に基づいて画像を検索するなどのタスクを実行できます。

Gemini Embedding 2 には、エンベディングの品質と柔軟性を最適化するための新機能がいくつか導入されています。

カスタムタスクの説明: タスクの説明（task:code retrieval や task:search result など）を指定することで、目的の関係に合わせてエンベディングを最適化し、特定の目標に対してより正確な結果を取得できます。
調整可能な結果サイズ: デフォルトでは、3, 072 次元の浮動小数点ベクトルが生成されます。output_dimensionality パラメータを指定すると、より小さい次元の出力を取得できます。
ドキュメント OCR: ドキュメント入力から OCR を読み取ります。
音声トラックの抽出: 動画入力から音声トラックを抽出し、動画フレームとインターリーブします。

Agent Platformで試す（プレビュー）サンプルアプリをデプロイする

注: 「サンプルアプリをデプロイする」機能を使用するには、課金と Agent Platform API が有効になっている Google Cloud プロジェクトが必要です。

技術仕様
モデル ID	`gemini-embedding-2`
サポートされている入出力	入力: テキスト、画像、音声、動画、 PDF 出力: エンベディング
トークンの上限	最大入力トークン: 8,192 最大出力トークン: N/A
シーケンスの最大長	8,192 トークン
出力のサイズ	最大 3,072（MRL サポートあり）
使用オプション	サポート対象 Standard PayGo 対象外プロビジョンドスループット Flex PayGo Priority PayGo バッチ予測
使用オプション	詳細については、使用オプションをご覧ください。
	画像検索	プロンプトあたりの最大画像数: 6 インラインデータまたはコンソールから直接アップロードする場合のファイルあたりの最大ファイルサイズ: 上限なし Google Cloud Storage からのファイルあたりの最大ファイルサイズ: 上限なしプロンプトあたりの出力画像の最大数: N/A サポートされている MIME タイプ: `image/png`、 `image/jpeg`
	ドキュメント	プロンプトあたりの最大ファイル数: 1 ファイルあたりの最大ページ数: 6 ファイルあたりの最大ファイルサイズ: N/A サポートされている MIME タイプ: `application/pdf`
	動画	動画の長さの上限（音声あり）: 80 秒動画の長さの上限（音声なし）: 120 秒プロンプトあたりの動画の最大数: 1 サポートされている MIME タイプ: `video/mpeg`、 `video/mp4`
	音声	プロンプトあたりの音声の最大長: 180 秒プロンプトあたりの音声ファイルの最大数: 1 サポートされている MIME タイプ: `audio/mp3`、 `audio/wav`
	パラメータのデフォルト
サポートされるリージョン
	モデルの提供	グローバル global 米国（マルチリージョン） us ヨーロッパ（マルチリージョン） eu
	詳細については、デプロイとエンドポイントをご覧ください。
ナレッジカットオフ日	2025 年 11 月
バージョン	`gemini-embedding-2` リリースステージ: GA リリース日: 2026 年 4 月 22 日 `gemini-embedding-2-preview` リリースステージ: 公開プレビュー版リリース日: 2026 年 3 月 10 日
セキュリティ管理
セキュリティ管理	詳細については、セキュリティ管理をご覧ください。
サポートされている言語	サポートされている言語をご覧ください。
料金	料金をご覧ください。

Gemini エンベディング 2 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

Gemini エンベディング 2