このページでは、Vertex AI で独自の ML モデルをトレーニングして使用するためのワークフローの概要について説明します。 Vertex AI には、完全自動化から完全カスタムまで、ニーズに対応するように設計されたさまざまなトレーニング方法が用意されています。
- AutoML: Google の自動 ML 機能を利用して、最小限の技術的な作業で高品質のモデルを構築します。
- Vertex AI サーバーレス トレーニング: インフラストラクチャを心配することなく、フルマネージドのオンデマンド環境でカスタム トレーニング コードを実行します。
- Vertex AI Training クラスタ: 独占的に使用するために予約された専用のアクセラレータ クラスタで、大規模で高パフォーマンスなトレーニング ジョブを実行します。
- Ray on Vertex AI: マネージド サービスでオープンソースの Ray フレームワークを使用して、Python アプリケーションと ML ワークロードをスケーリングします。
どの方法を使用するかを決定する方法については、トレーニング方法を選択するをご覧ください。
AutoML
Vertex AI の AutoML では、ユーザーが提供するトレーニング データに基づいて、コード不要の ML モデルを構築できます。AutoML は、さまざまなデータ型と予測タスクのデータ準備、モデル選択、ハイパーパラメータ調整、デプロイなどのタスクを自動化できるため、幅広いユーザーが ML を利用しやすくなります。
AutoML で作成できるモデルの種類
構築できるモデルの種類はデータのタイプによって異なります。Vertex AI は、次のデータ型とモデルの目的に対応する AutoML ソリューションを提供します。
| データのタイプ | サポートされる目的 |
|---|---|
| 画像データ | 分類、オブジェクト検出 |
| 表形式データ | 分類 / 回帰、予測 |
AutoML の詳細については、AutoML トレーニングの概要をご覧ください。
Vertex AI でカスタム トレーニング コードを実行する
AutoML でニーズに対応できない場合は、独自のトレーニング コードを提供して、Vertex AI のマネージド インフラストラクチャでそのコードを実行できます。これにより、モデルのアーキテクチャとトレーニング ロジックを完全に制御し、柔軟に扱うことができるため、任意の ML フレームワークを使用できます。
Vertex AI には、カスタム トレーニング コードを実行するための 2 つの主要なモード(サーバーレスのオンデマンド環境と専用の予約済みクラスタ)があります。
Vertex AI サーバーレス トレーニング
サーバーレス トレーニングはフルマネージド サービスであり、インフラストラクチャのプロビジョニングや管理を行うことなく、カスタム トレーニング アプリケーションを実行できます。コードをコンテナにパッケージ化し、マシン仕様(CPU や GPU など)を定義して、CustomJob として送信します。
残りの処理は Vertex AI が行います
- ジョブの実行中にコンピューティング リソースをプロビジョニングする。
- トレーニング コードを実行する。
- ジョブの完了後にリソースを削除する。
この従量課金制のオンデマンド モデルは、試験運用、迅速なプロトタイピング、保証された瞬間的な容量を必要としない本番環境のジョブに最適です。
詳細については、サーバーレス トレーニング カスタムジョブを作成するをご覧ください
Vertex AI Training クラスタ
大規模で高パフォーマンスのミッション クリティカルなトレーニングでは、専用のアクセラレータ クラスタを予約できます。これにより容量が保証され、キューが排除され、ジョブがすぐに開始されます。
これらのリソースを独占的に使用できますが、Vertex AI はハードウェア メンテナンスや OS パッチ適用など、クラスタの管理に関する運用オーバーヘッドを引き続き処理します。この「マネージド サーバーフル」アプローチにより、管理の複雑さを伴うことなく、専用クラスタの能力を活用できます。
Ray on Vertex AI
Ray on Vertex AI は、オープンソースの Ray フレームワークを使用して、Vertex AI プラットフォーム内で AI と Python アプリケーションを直接スケーリングできるサービスです。Ray は、ML ワークフローの分散コンピューティングと並列処理のためのインフラストラクチャを提供するように設計されています。
Ray on Vertex AI は、Ray フレームワークを使用して分散アプリケーションを実行するためのマネージド環境を提供し、 Google Cloud サービスとのスケーラビリティと統合を実現します。
Ray on Vertex AI の詳細については、Ray on Vertex AI の概要をご覧ください。