Gemini Enterprise Agent Platform には、生成 AI モデルのスループットを管理するさまざまな方法が用意されています。これにより、費用とパフォーマンスのバランスを取ることが可能です。このドキュメントでは、柔軟な従量課金制モデルと、予測可能なスループットのための予約済み容量という利用可能なオプションについて説明します。
マネージド モデルの割り当て
Agent Platform には、Gemini Enterprise Agent Platform のマネージド生成 AI モデルのスループットを管理する 2 つの方法が用意されています。これにより、費用、柔軟性、パフォーマンスのバランスを取ることが可能になります。従量課金制モデルを使用するか、一定量のスループットを固定価格で予約できます。
Pay-as-you-go
デフォルトの従量課金制モデルの場合、Agent Platform は Standard 従量課金制(Standard PayGo)を使用します。 PayGo では、事前の財務上のコミットメントを必要とせずに、使用したリソースに対してのみ料金を支払うことができます。費用とパフォーマンスが異なる追加の PayGo オプションがあります。詳細については、 優先度 PayGo または Flex PayGoをご覧ください。
予約済み容量
一貫したパフォーマンスと予測可能な費用を必要とする重要な本番環境アプリケーションには、プロビジョンド スループットを使用できます。プロビジョンド スループットは、選択したロケーションのモデルに対して特定のスループット量を予約する固定料金のサブスクリプションです。
生成 AI サービスの割り当て
Gemini Enterprise Agent Platform は、モデル チューニング、モデル評価、バッチ予測、エンベディング、検索拡張生成などの一連の生成 AI サービスを提供します。これらのサービスの割り当ての詳細については、 Gemini Enterprise Agent Platform の生成 AI の割り当てとシステム上限をご覧ください。
次のステップ
- Standard PayGo の詳細を確認する。
- プロビジョンド スループットの詳細を 確認する。
- 生成 AI の割り当てとシステム上限の詳細を確認する。
- Google Cloud の割り当ての詳細を確認する。