マネージド データセットを使用すると、Vertex AI での AutoML モデルとカスタムモデルのトレーニングに使用するソースデータを提供できます。マネージド データセットは、AutoML では必須で、カスタム トレーニングでは任意です。
権限とアクセス制御
Cloud Storage バケットのデータを使用してデータセットを作成する場合、Vertex AI にはデータにアクセスするための権限が必要です。Vertex AI は、サービス エージェントと呼ばれる特別な Google 管理のサービス アカウントを使用して、データに安全にアクセスします。必要なロールとサービス エージェントの仕組みの詳細については、IAM を使用したアクセス制御をご覧ください。
AutoML モデル用のマネージド データセットを作成する
AutoML モデルのトレーニング用のマネージド データセットは、Google Cloud コンソールまたは Vertex AI API を使用して作成できます。これを行う手順は、データ型とモデルの目的によって若干異なります。まず、トレーニング データを準備します。
画像
次のタイプの画像 AutoML モデル用にマネージド データセットを作成する方法について説明します。
表形式
次のタイプの表形式 AutoML モデル用にマネージド データセットを作成する方法について説明します。
動画
次のタイプの動画 AutoML モデル用にマネージド データセットを作成する方法について説明します。
カスタム トレーニング モデル用のマネージド データセットを作成する
カスタムモデルのトレーニングに使用するマネージド データセットの作成方法は、データ型やモデルの目的に関係なく同じです。
詳細については、マネージド データセットを使用するをご覧ください。
Data Catalog を使用してマネージド データセットを表示する
Data Catalog は、フルマネージドでスケーラブルなメタデータ管理サービスです。このサービスを使用すると、プロジェクトやリージョンをまたいでデータセットを検索するための一元化されたロケーションが提供されます。
詳細については、Data Catalog を使用してモデルとデータセットのリソースを検索するの概要をご覧ください。