カスタム トレーニング ジョブを使用すると、Vertex AI でカスタム機械学習(ML)トレーニング コードを実行できます。
CustomTrainingJobOp
CustomTrainingJobOp コンポーネントは、CustomJob リソースの全機能を公開しています。これにより、ContainerSpec または PythonPackageSpec インスタンスによる単一トレーニングと分散トレーニングを行うことができます。
create_custom_training_job_from_component 関数
create_custom_training_job_from_component ユーティリティは、指定されたコンテナや Python コンポーネントを、Vertex AI でカスタムジョブを実行するコンポーネントに変換します。これにより、カスタム トレーニング ジョブの作成が簡単になります。指定されたコンポーネントのすべての入力と出力が、構築されたトレーニング ジョブ オペレータにコピーされます。
なお、このユーティリティによって ClusterSpec が構築され、そこではプライマリとすべてのワーカーが同じ仕様を使います。つまり、すべてのディスクとマシン仕様関連のパラメータがすべてのレプリカに適用されます。これは、MultiWorkerMirroredStrategy や MirroredStrategy を使用してトレーニングする場合などのユースケースに適しています。
このコンポーネントでは、CustomJob Python パッケージ トレーニングや、異なるワーカープール仕様の分散トレーニングはサポートしていません。
API リファレンス
- コンポーネントのリファレンスについては、CustomJob コンポーネントのGoogle Cloud SDK リファレンスをご覧ください。
- Vertex AI API リファレンスについては、
CustomJobリソースのページをご覧ください。
変更履歴とリリースノート
Google Cloud パイプライン コンポーネント SDK の変更履歴と変更点については、Google Cloud パイプライン コンポーネント SDK リリースノートをご覧ください。
テクニカル サポートの連絡先
不明な点がございましたら、kubeflow-pipelines-components@google.com までお問い合わせください。