Gemini 3 Flash は、Gemini 3 Pro の推論機能と、Flash ラインのレイテンシ、効率、コストのレベルを組み合わせています。推論の改善により日常的なタスクをこなせるだけでなく、最も複雑なエージェント ワークフローにも対応できるように設計されています。
Gemini 3 Flash では、パフォーマンス、制御、マルチモーダルの忠実度を向上させるための新機能がいくつか導入されています。
思考レベル:
thinking_levelパラメータを使用して、モデルが実行する内部推論の量(最小、低、中、高)を制御し、回答の品質、推論の複雑さ、レイテンシ、費用を調整します。Gemini 3 モデルでは、thinking_levelパラメータがthinking_budgetに変わりました。さまざまな思考レベルの詳細については、思考をご覧ください。
思考シグネチャ: 思考シグネチャの検証を厳しくすることで、マルチターンの関数呼び出しの信頼性が向上しました。
メディアの解像度:
media_resolutionパラメータ(低、中、高、超高)を使用して、マルチモーダル入力のビジョン処理を制御します。これは、トークンの使用量とレイテンシに影響します。デフォルトの解像度設定については、Gemini 3 を使ってみるをご覧ください。- メディアの解像度レベルの ultra high は、
IMAGEモダリティでのみ使用できます。 - PDF トークン数は、
usage_metadataのDOCUMENTモダリティではなくIMAGEモダリティに表示されます。
- メディアの解像度レベルの ultra high は、
マルチモーダル関数レスポンス: 関数レスポンスに、テキストに加えて画像や PDF などのマルチモーダル オブジェクトを含めることができるようになりました。
ストリーミング関数呼び出し: 部分関数呼び出し引数をストリーミングして、ツールを使用しているユーザーのエクスペリエンスを改善しました。
これらの機能の使用方法について詳しくは、Gemini 3 を使ってみるをご覧ください。
Vertex AI で試す Model Garden で表示する (プレビュー)サンプルアプリをデプロイする
| モデル ID | gemini-3-flash-preview |
|
|---|---|---|
| サポートされている入出力 |
|
|
| トークンの上限 |
|
|
| 機能 | ||
| 使用タイプ |
|
|
| 技術仕様 | ||
| 画像 |
|
|
| ドキュメント |
|
|
| 動画 |
|
|
| 音声 |
|
|
| パラメータのデフォルト |
|
|
| サポートされるリージョン | ||
|
モデルの提供 (Standard PayGo とプロビジョンド スループットを含む) |
|
|
| 詳細については、デプロイとエンドポイントをご覧ください。 | ||
| ナレッジ カットオフ日 | 2025 年 1 月 | |
| バージョン |
|
|
| セキュリティ管理 | ||
| オンライン予測 |
|
|
| バッチ予測 |
|
|
| チューニング |
|
|
| コンテキストのキャッシュ保存 |
|
|
| 詳細については、セキュリティ管理をご覧ください。 | ||
| サポートされている言語 | サポートされている言語をご覧ください。 | |
| 料金 | 料金をご覧ください。 | |