このページでは、Gemini Enterprise Agent Platform の PyTorch 統合について説明します。また、Gemini Enterprise Agent Platform で PyTorch を使用する方法を説明するリソースについて紹介します。Gemini Enterprise Agent Platform の PyTorch 統合を使用すると、本番環境で PyTorch モデルのトレーニング、デプロイ、オーケストレーションを容易に行うことができます。
ノートブックでコードを実行する
Agent Platform には、ノートブックでコードを実行する方法として Colab Enterprise と Vertex AI Workbench という 2 つのオプションがあります。 これらのオプションの詳細については、 ノートブック ソリューションを選択するをご覧ください。
トレーニング用のビルド済みコンテナ
Gemini Enterprise Agent Platform には、モデル トレーニング用にビルド済みの Docker コンテナ イメージが用意されています。 これらのコンテナは ML フレームワークとフレームワーク バージョン別に編成され、トレーニング コードで必要となる一般的な依存関係が含まれています。ビルド済みのトレーニング コンテナを使用する PyTorch バージョンと、ビルド済みのトレーニング コンテナでモデルをトレーニングする方法については、カスタム トレーニング用のビルド済みコンテナをご覧ください。
推論を提供するビルド済みコンテナ
Gemini Enterprise Agent Platform には、バッチ推論とオンライン推論の両方を提供するビルド済みの Docker コンテナ イメージが用意されています。 これらのコンテナは ML フレームワークとフレームワーク バージョン別に編成され、推論コードで必要となる一般的な依存関係が含まれています。ビルド済みの推論コンテナを含む PyTorch バージョンと、ビルド済みの推論コンテナでモデルを提供する方法については、カスタム トレーニング用のビルド済みコンテナをご覧ください。
分散トレーニング
Gemini Enterprise Agent Platform では、PyTorch モデルの分散トレーニングを実行できます。マルチワーカー トレーニングの場合、Reduction Server を使用して、all-reduce グループ演算に合わせてパフォーマンスをさらに最適化できます。Gemini Enterprise Agent Platform での 分散トレーニングの詳細については、 分散トレーニングをご覧ください。
Gemini Enterprise Agent Platform で PyTorch を使用するためのリソース
Gemini Enterprise Agent Platform での PyTorch の詳細とそれを使用する方法については、次のリソースをご覧ください。
- Gemini Enterprise Agent Platform で PyTorch モデルのトレーニングとチューニングを行う方法: PyTorch を使用して感情テキスト分類モデルを構築およびトレーニングする Gemini Enterprise Agent Platform Training と、PyTorch モデルのハイパーパラメータをチューニングする Gemini Enterprise Agent Platform ハイパーパラメータ チューニング について説明します。
- Gemini Enterprise Agent Platform に PyTorch モデルをデプロイする方法: Vertex AI Inference サービスにモデル アーティファクトをデプロイすることで、TorchServe をカスタム コンテナとして使用し、Pytorch モデルをデプロイする方法について説明します。
- Gemini Enterprise Agent Platform Pipelines での PyTorch ML ワークフローのオーケストレーション: Gemini Enterprise Agent Platform Pipelines を使用して、 Google Cloud Gemini Enterprise Agent Platform 上で PyTorch モデルをトレーニングしてデプロイするための ML パイプラインを構築およびオーケストレートする方法について説明します。
- Kubeflow Pipelines と Vertex Pipelines 上の PyTorch を使用したスケーラブルな ML ワークフロー: PyTorch ベースの ML ワークフローの例を、OSS Kubeflow Pipelines(Kubeflow プロジェクトの一部)と Gemini Enterprise Agent Platform Pipelines で紹介します。また、Kubeflow Pipelines に追加された 新しい PyTorch 組み込みコンポーネント についても説明します。
- Agent Platform のビルド済みコンテナを使用した PyTorch 画像モデルのサービング: このノートブックでは、ビルド済みの PyTorch サービング イメージを使用して、 Agent Platform に PyTorch 画像分類モデルをデプロイします。
次のステップ
- チュートリアル: コンソールから Gemini Enterprise Agent Platform を使用して、Gemini Enterprise Agent Platform のビルド済みコンテナ環境のいずれかで PyTorch 画像
分類モデルをトレーニングする。
Google Cloud
このタスクを Google Cloud コンソールで直接行う際の順を追ったガイダンスについては、「ガイドを表示」をクリックしてください。