マネージド データセットを使用すると、Gemini Enterprise Agent Platform での AutoML モデルとカスタムモデルのトレーニングに使用するソースデータを提供できます。マネージド データセットは、AutoML では必須で、カスタム トレーニングでは任意です。
権限とアクセス制御
Cloud Storage バケットのデータを使用してデータセットを作成する場合、Agent Platform にはデータにアクセスするための権限が必要です。Agent Platform は、サービス エージェントと呼ばれる特別な Google が管理するサービス アカウントを使用して、データに安全にアクセスします。必要なロールとサービス エージェントの仕組みの詳細については、IAM を使用したアクセス制御をご覧ください。
AutoML モデル用のマネージド データセットを作成する
AutoML モデルのトレーニング用のマネージド データセットは、Google Cloud コンソールまたは Agent Platform API を使用して作成できます。これを行う手順は、データ型とモデルの目的によって若干異なります。まず、トレーニング データを準備します。
画像
次のタイプの画像 AutoML モデル用にマネージド データセットを作成する方法について説明します。
表形式
次のタイプの表形式 AutoML モデル用にマネージド データセットを作成する方法について説明します。
カスタム トレーニング モデル用のマネージド データセットを作成する
カスタムモデルのトレーニングに使用するマネージド データセットの作成方法は、データ型やモデルの目的に関係なく同じです。
詳細については、マネージド データセットを使用するをご覧ください。
Knowledge Catalog を使用してマネージド データセットを表示する
Knowledge Catalog は、フルマネージドでスケーラブルなメタデータ管理サービスです。このサービスを使用すると、プロジェクトやリージョンをまたいでデータセットを検索するための一元化されたロケーションが提供されます。Vertex AI と統合されており、非推奨の Data Catalog と同様の機能を提供します。
Knowledge Catalog を使用すると、アスペクト(Data Catalog タグに類似)を使用してデータを検出、理解、拡充できます。
Vertex AI リソースのメタデータとアスペクトの管理の詳細については、Knowledge Catalog のアスペクトを管理してメタデータを拡充するをご覧ください。