Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

最新の Gemini モデルに移行する

このガイドでは、アプリケーションを最新の Gemini バージョンに更新する方法について説明します。このガイドは、すでに古いバージョンの Gemini を使用しているアプリケーションを前提にしています。Gemini Enterprise Agent Platform で Gemini の使用を開始する方法については、Gemini Enterprise Agent Platform の Gemini API のクイックスタートをご覧ください。

このガイドでは、アプリケーションを Agent Platform SDK から現在の Google Gen AI SDK に切り替える方法については説明しません。詳細については、Agent Platform SDK 移行ガイドをご覧ください。

予想される変化

ほとんどの生成 AI アプリケーションを最新の Gemini バージョンに更新する際に、コードやプロンプトの変更はほとんど必要ありません。ただし、一部のアプリケーションでは、プロンプトの調整が必要になる場合があります。新しいバージョンでプロンプトをテストせずに、これらの変更を予測することは困難です。完全に移行する前に、徹底的なテストを実施することをおすすめします。効果的なプロンプトを作成するためのヒントについては、プロンプト戦略のガイダンスをご覧ください。プロンプトの健全性チェックリストを使用して、プロンプトの問題を特定して解決します。

トークン数のレポートの更新

インフラストラクチャのアップグレードにより、以前のシステムではカウントされていなかったレスポンススキーマや関数呼び出しなどの複雑なメタデータを含む、すべてのリクエストコンポーネントが正確にキャプチャされるようになったため、報告されるトークン数の増加が予想されます。

大幅なコード変更が必要になるのは、特定の破壊的変更に対応する場合や、新しい Gemini 機能を使用する場合のみです。

どの Gemini モデルに移行すればよいか

使用する Gemini モデルは、アプリケーションのニーズによって異なります。

機能	2.5 Pro	2.5 Flash	2.5 Flash-Lite	3 Flash	3.1 Pro	3.1 Flash-Lite	3.5 Flash
リリースステージ	一般提供	一般提供	一般提供	プレビュー	プレビュー	一般提供	GA
入力モダリティ	テキスト、コード、画像、音声、動画	テキスト、コード、画像、音声、動画	テキスト、コード、画像、音声、動画	テキスト, コード, 画像, 音声, 動画, PDF	テキスト, コード, 画像, 音声, 動画, PDF	テキスト, コード, 画像, 音声, 動画, PDF	テキスト, コード, 画像, 音声, 動画, PDF
出力モダリティ	テキスト	テキスト	テキスト	テキスト	テキスト	テキスト	テキスト
コンテキストウィンドウ、トークンの合計上限	1,048,576	1,048,576	1,048,576	1,048,576	1,048,576	1,048,576	1,048,576
出力コンテキストの長さ	65,535（デフォルト）	65,535（デフォルト）	65,535（デフォルト）	65,536	65,536	65,535（デフォルト）	65,535（デフォルト）
Google 検索によるグラウンディング
関数呼び出し
コードの実行
暗黙的なコンテキストのキャッシュ保存
明示的なコンテキストのキャッシュ保存
バッチ予測
Gemini Live API
ファインチューニング
レイテンシ
推奨 SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK
料金単位	トークン	トークン	トークン	トークン	トークン	トークン	トークン
廃止日	2026 年 10 月 16 日以降	2026 年 10 月 16 日以降	2026 年 10 月 16 日以降

移行を開始する前に

移行プロセスを開始する前に、次の点を考慮する必要があります。

情報セキュリティ（InfoSec）、ガバナンス、規制当局の承認
ロケーションの対応状況
モダリティとトークン化に基づく価格差
プロビジョンドスループットの注文を購入または変更する
教師ありファインチューニング
回帰テスト

情報セキュリティ、ガバナンス、規制当局の承認

情報セキュリティ（InfoSec）、リスク、コンプライアンスの各チームから早期に承認を得ます。特に医療や金融などの規制の厳しい業界では、特定のリスクとコンプライアンスルールをすべて網羅します。

ロケーションの対応状況

Gemini Enterprise Agent Platform の Google モデルとパートナーモデル、生成 AI 機能は、特定のリージョンエンドポイントとグローバルエンドポイントで使用できます。グローバルエンドポイントは全世界を対象としており、単一リージョンと比較して可用性と信頼性が向上しています。

リージョンエンドポイントの可用性はモデルによって異なります。各モデルの詳細については、ロケーションガイドをご覧ください。

モダリティとトークン化に基づく価格差

料金は Gemini モデルごとに異なります。料金ページには、モデルごとのすべてのモダリティ（テキスト、コード、画像、音声など）の費用が記載されています。

プロビジョンドスループットの注文を購入または変更する

必要に応じて、プロビジョンドスループットを追加購入するか、既存のプロビジョンドスループットの注文を変更します。

教師ありファインチューニング

最新の Gemini モデルは、出力の品質が向上しています。これは、アプリケーションでファインチューニング済みモデルが不要になったことを意味する場合があります。アプリケーションで古い Gemini モデルを使用して教師ありファインチューニングを使用している場合は、まずファインチューニングを行わずに最新のモデルでアプリケーションをテストし、結果を評価します。

教師ありファインチューニングを使用する場合、以前の Gemini バージョンから既存のチューニング済みモデルを移動することはできません。新しい Gemini バージョン用に新しいチューニングジョブを実行する必要があります。

新しい Gemini モデルをチューニングする場合は、デフォルトのチューニング設定から始めます。チューニングサービスは最新バージョン用に最適化されているため、以前の Gemini バージョンのハイパーパラメータ値を再利用しないでください。古い設定を再利用しても、最適な結果が得られる可能性は低くなります。

回帰テスト

最新の Gemini バージョンにアップグレードする場合は、次の 3 種類の回帰テストが必要です。

コード回帰テスト: ソフトウェアエンジニアリングとデベロッパーオペレーション（DevOps）の観点からの回帰テスト。このタイプのリグレッションテストは常に必要です。
モデルパフォーマンスの回帰テスト: データサイエンスまたは ML の観点からの回帰テスト。つまり、新しい Gemini モデルバージョンが、少なくとも以前のバージョンと同じレベルの品質を維持する出力を提供するようにします。

モデルパフォーマンスの回帰テストは、システムまたはその基盤となるモデルが変更されたときに実行されるモデル評価です。次のようなものがあります。
- オフラインパフォーマンステスト: さまざまなモデル出力品質指標に基づいて、専用のテスト環境でモデル出力の品質をアサートするテスト。
- オンラインモデルのパフォーマンステスト: 暗黙的または明示的なユーザーフィードバックに基づいて、ライブのオンラインデプロイでのモデル出力の品質をアサートするテスト。
負荷テスト: アプリケーションが多数のリクエストを同時に処理できるかどうかをテストします。負荷テストは、プロビジョンドスループットを使用するアプリケーションに必要です。

Gemini 3.x のパラメータの更新とベストプラクティス

以下は、Gemini 3.5 Flash を含むすべての Gemini 3.x モデルに適用されます。これらは Gemini 3 で導入されたもので、参考としてここに記載します。

サンプリングパラメータ（非推奨）

temperature、top_p、top_k は、すべての Gemini 3.x モデルで推奨されなくなりました。モデルは、最適な結果を得るために独自のサンプリングを管理します。すべてのリクエストからこれらのパラメータを削除します。

決定性を最大化するには、特定のユースケースの明示的なルールを使用してシステム指示を定義することをおすすめします。

`thinking_budget`（非推奨）

Gemini 3.x モデル全体で、未加工の数値 thinking_budget パラメータは推奨されなくなりました。代わりに thinking_level 文字列列挙型を使用してください。

関数呼び出し: 厳密なレスポンスマッチング

API はまだエラーを返しませんが、レスポンスが一致しないと、ほとんどの場合、モデルは finish_reason: STOP を含む空のレスポンスを返します。次の規則に必ず従ってください。

id を含める: すべての FunctionResponse に、対応する FunctionCall の id を含める必要があります。
name を照合: レスポンスの name は、呼び出しの name と一致する必要があります。
一致数: 受信した FunctionCall ごとに 1 つの FunctionResponse を返します。

マルチモーダル関数レスポンス

関数呼び出しへのレスポンスでマルチモーダルコンテンツ（画像など）を提供する場合は、コンテンツを関数レスポンス部分の内側に含めます。外側には含めないでください。これにより、思考の漏洩などの予期しないモデルの動作を防ぐことができます。

関数レスポンスのインライン指示

関数レスポンスとともにプラットフォームの手順を提供する必要がある場合は、別々の部分としてではなく、2 つの改行で区切って関数レスポンステキストの末尾に追加します。

不要なツール呼び出しを減らす

ツール呼び出しの過剰な使用が発生した場合: 1. 思考レベルを下げる（medium、low、minimal）。 2. システム指示を追加して、ツールの使用を制限します（例: "You have a limited action budget of <n> tool calls. Use them efficiently."）。

移行チェックリスト

Gemini 3 Flash プレビュー

モデル名を gemini-3-flash-preview から gemini-3.5-flash に更新。
料金を確認します。Gemini 3.5 Flash は Gemini 3 Flash プレビューよりも高価です。
構成から temperature、top_p、top_k を削除します。
thinking_budget を thinking_level に置き換えます。
すべての FunctionResponse パーツに id と一致する name を追加しました。
プロンプトをテストします。デフォルトの労力が high → medium に変更されました。
思考の保存がデフォルトでオンになりました。推論コンテキストはターンをまたいで引き継がれます。
思考レベルを調整するか、システム指示を追加して、不要なツール呼び出しを減らします。
現時点では、Gemini 3.5 Flash でのパソコンの使用はサポートされていません。
追従を軽減する: gemini-3.5-flash が追従の兆候を示し始めた場合は、次のコードを追加して、システム指示でこの動作を軽減することを試すことができます。 - Keep your responses concise. - Provide a summary of your work when you end your turn. Ground your response in the work you did. Keep your tone professional and avoid overconfident language, bragging, or overclaiming success. - AVOID using superlatives such as "perfectly", "flawlessly", "100% correct", "Summary of Accomplishments" etc. to summarize your work for the user. Be humble. - AVOID over-the-top politeness or complimenting the user excessively. - Format your responses in github-style markdown.

Gemini 2.5 で生成

PDF とドキュメントのワークロードをテストします。PDF のトークン使用量が増加する可能性があります。
プロンプトを簡素化します。複雑な Chain-of-Thought プロンプトではなく、よりシンプルなプロンプトで thinking_level: "medium" または "high" を試してください。
ツール（検索、URL コンテキスト、コード実行、関数）の組み合わせを最大限に活用します。
関数レスポンス部分内のマルチモーダルコンテンツを移動します。
関数レスポンステキストにインライン指示を追加します。

モデルの性能を高める

移行する際は、次のヒントを適用して、選択した Gemini モデルから最適なパフォーマンスを得てください。

すべての Gemini 3 モデルで、サンプリングパラメータ（temperature、top_p、top_k）は非推奨になりました。モデルは、最適な結果を得るために独自のサンプリングを管理します。Google では、すべてのリクエストからこれらのパラメータを削除することをおすすめします。
システム指示、プロンプト、少数ショット学習の例に、矛盾や無関係な指示や例がないか確認します。
より強力なモデルをテストします。たとえば、Gemini 2.0 Flash-Lite を評価した場合は、Gemini 2.0 Flash を試してください。
自動評価の結果が人間の判断と一致していることを確認します。特に、判定モデルを使用した結果を確認します。判定モデルの指示が明確で一貫性があり、曖昧でないことを確認します。
判定モデルの指示を改善するには、複数の人間が個別に作業する状況で指示をテストします。人によって指示の解釈が異なり、判断が食い違うようであれば、判定モデルの指示が不明確です。
モデルをファインチューニングします。
特定のタイプの障害を示すパターンについて、評価出力を調べます。モデル、タイプ、カテゴリ別にエラーをグループ化すると、より的を絞った評価データが得られ、プロンプトを調整してこれらのエラーを修正しやすくなります。
さまざまな生成 AI コンポーネントを個別に評価していることを確認します。
トークンサンプリングパラメータの調整を試します。

困ったときは

サポートが必要な場合は、 Google Cloud でニーズに合ったサポートパッケージをご利用ください。たとえば、24 時間 365 日の対応や電話サポート、テクニカルサポートマネージャーへのお問い合わせなどがあります。詳細については、Google Cloud サポートをご覧ください。

次のステップ

ガイド

最新の Gemini モデルに移行する

予想される変化

トークン数のレポートの更新

どの Gemini モデルに移行すればよいか

移行を開始する前に

情報セキュリティ、ガバナンス、規制当局の承認

ロケーションの対応状況

モダリティとトークン化に基づく価格差

プロビジョンドスループットの注文を購入または変更する

教師ありファインチューニング

回帰テスト

最新バージョンに移行する方法

1. ドキュメントモデルの評価とテストの要件

2. コードをアップグレードしてテストを実行する

Google Gen AI SDK にアップグレードする

Gemini の呼び出しを変更する

互換性を損なうコードの変更を修正する

3. オフライン評価を実行する

4. 評価結果を評価し、プロンプトとハイパーパラメータを調整する

5. 負荷テストを実行する

6. （省略可）オンライン評価を実行する

7. 本番環境にデプロイする

Gemini 3.x のパラメータの更新とベストプラクティス

サンプリングパラメータ（非推奨）

`thinking_budget`（非推奨）

関数呼び出し: 厳密なレスポンスマッチング

マルチモーダル関数レスポンス

関数レスポンスのインライン指示

不要なツール呼び出しを減らす

移行チェックリスト

Gemini 3 Flash プレビュー

Gemini 2.5 で生成

モデルの性能を高める

困ったときは

次のステップ

Agent Platform を使ってみる

Google モデル

パートナーのモデル

オープンモデル

よくある質問

最新の Gemini モデルに移行する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

予想される変化

トークン数のレポートの更新

どの Gemini モデルに移行すればよいか

移行を開始する前に

情報セキュリティ、ガバナンス、規制当局の承認

ロケーションの対応状況

モダリティとトークン化に基づく価格差

プロビジョンド スループットの注文を購入または変更する

教師ありファインチューニング

回帰テスト

最新バージョンに移行する方法

1. ドキュメント モデルの評価とテストの要件

2. コードをアップグレードしてテストを実行する

Google Gen AI SDK にアップグレードする

Gemini の呼び出しを変更する

互換性を損なうコードの変更を修正する

3. オフライン評価を実行する

4. 評価結果を評価し、プロンプトとハイパーパラメータを調整する

5. 負荷テストを実行する

6. （省略可）オンライン評価を実行する

7. 本番環境にデプロイする

Gemini 3.x のパラメータの更新とベスト プラクティス

サンプリング パラメータ（非推奨）

thinking_budget（非推奨）

関数呼び出し: 厳密なレスポンス マッチング

マルチモーダル関数レスポンス

関数レスポンスのインライン指示

不要なツール呼び出しを減らす

移行チェックリスト

Gemini 3 Flash プレビュー

Gemini 2.5 で生成

モデルの性能を高める

困ったときは

次のステップ

Agent Platform を使ってみる

Google モデル

パートナーのモデル

オープンモデル

よくある質問

最新の Gemini モデルに移行する

プロビジョンドスループットの注文を購入または変更する

1. ドキュメントモデルの評価とテストの要件

Gemini 3.x のパラメータの更新とベストプラクティス

サンプリングパラメータ（非推奨）

`thinking_budget`（非推奨）

関数呼び出し: 厳密なレスポンスマッチング