您可以使用代管資料集,提供在 Vertex AI 上訓練 AutoML 和自訂模型時使用的來源資料。AutoML 必須使用代管資料集,自訂訓練則可選擇是否使用。
權限和存取權控管
使用 Cloud Storage 值區中的資料建立資料集時,Vertex AI 需要存取資料的權限。Vertex AI 會使用稱為「服務代理」的特殊 Google 代管服務帳戶,安全地存取您的資料。如要進一步瞭解必要角色和服務代理程式的運作方式,請參閱「使用 IAM 控管存取權」。
為 AutoML 模型建立代管資料集
您可以使用Google Cloud 控制台或 Vertex AI API,建立代管資料集來訓練 AutoML 模型。操作說明會因資料類型和模型目標而略有不同。首先準備訓練資料。
圖片
瞭解如何為下列類型的圖片 AutoML 模型建立受管理資料集:
表格
瞭解如何為下列類型的表格 AutoML 模型建立代管資料集:
建立自訂訓練模型的代管資料集
無論資料類型或模型目標為何,建立代管型資料集來訓練自訂模型的操作說明都相同。
詳情請參閱「使用受管理的資料集」。
使用 Dataplex Universal Catalog 查看受管理資料集
Dataplex Universal Catalog 是可擴充的全代管中繼資料管理服務,提供集中式位置,可搜尋專案和區域中的資料集。這項服務與 Vertex AI 整合,並提供與已淘汰的 Data Catalog 類似的功能。
您可以使用 Dataplex Universal Catalog 探索、瞭解及擴充資料,並加入切面 (類似於 Data Catalog 標記)。
如要瞭解如何管理 Vertex AI 資源的中繼資料和切面,請參閱 Dataplex Universal Catalog 中的「管理切面及豐富中繼資料」。