フィードバックを送信
オンライン予測について学習する
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
プレビュー: オンライン予測は、現状のまま提供されるプレビュー機能であり、本番環境には推奨されません。Google は、プレビュー機能に対してサービスレベル契約(SLA)やテクニカル サポートのコミットメントを提供していません。詳細については、GDC の機能ステージ をご覧ください。 Vertex AI は、Online Prediction API を介して Google Distributed Cloud(GDC)エアギャップでオンライン予測を提供します。予測とは、トレーニング済み ML モデルの出力です。具体的には、オンライン予測はモデルのエンドポイントに対して行われる同期リクエストです。
オンライン予測では、サポートされているコンテナのセット で独自の予測モデルを使用して、アップロード、デプロイ、サービング、リクエストを行うことができます。アプリケーションの入力に応じてリクエストを行う場合や、タイムリーな推論が必要な場合は、オンライン予測を使用します。
オンライン予測 API を使用するには、インフラストラクチャ オペレーター(IO)が作成した専用の予測クラスタ に Kubernetes カスタム リソースを適用します。
オンライン予測を取得する前に、モデル アーティファクトをエクスポート し、モデルをエンドポイントにデプロイ する必要があります。このアクションにより、コンピューティング リソースがモデルに関連付けられ、低レイテンシでオンライン予測が行われます。
次に、リクエストをフォーマット して送信 することで、カスタム トレーニング モデルからオンライン予測を取得できます。
使用可能なコンテナ イメージ
次の表に、Distributed Cloud のオンライン予測でサポートされているコンテナの一覧を示します。
ML フレームワーク
バージョン
サポートされているアクセラレータ
対応イメージ
TensorFlow
2.14
CPU
tf2-cpu.2-14
GPU
tf2-gpu.2-14
PyTorch
2.4
CPU
pytorch-cpu.2-4
GPU
pytorch-gpu.2-4
2.1(非推奨)
CPU
pytorch-cpu.2-1
GPU
pytorch-gpu.2-1
フィードバックを送信
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンス により使用許諾されます。コードサンプルは Apache 2.0 ライセンス により使用許諾されます。詳しくは、Google Developers サイトのポリシー をご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-12-06 UTC。
ご意見をお聞かせください
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-12-06 UTC。"],[],[]]