在 Vertex AI 上建立受管理資料集的總覽

您可以使用代管資料集,提供在 Vertex AI 上訓練 AutoML 和自訂模型時使用的來源資料。AutoML 必須使用代管資料集,自訂訓練則可選擇是否使用。

權限和存取控管

使用 Cloud Storage 值區中的資料建立資料集時,Vertex AI 需要存取資料的權限。Vertex AI 會使用稱為「服務代理」的特殊 Google 代管服務帳戶,安全地存取您的資料。如要進一步瞭解必要角色和服務代理的運作方式,請參閱「使用 IAM 控管存取權」。

為 AutoML 模型建立代管資料集

您可以使用Google Cloud 控制台或 Vertex AI API,建立代管資料集來訓練 AutoML 模型。操作說明會因資料類型和模型目標而略有不同。首先準備訓練資料。

圖片

瞭解如何為下列類型的圖片 AutoML 模型建立受管理資料集:

表格

瞭解如何為下列類型的表格 AutoML 模型建立代管資料集:

為自訂訓練模型建立代管資料集

無論資料類型或模型目標為何,建立代管型資料集來訓練自訂模型的操作說明都相同。

詳情請參閱「使用受管理的資料集」。

使用 Knowledge Catalog 查看受管理資料集

Knowledge Catalog 是可擴充的全代管中繼資料管理服務,提供集中式位置,方便您搜尋專案和區域中的資料集。這項服務已與 Vertex AI 整合,並提供與已淘汰的 Data Catalog 類似的功能。

您可以使用知識目錄探索、瞭解及充實資料,並加入類似於 Data Catalog 標記的層面。

如要進一步瞭解如何管理 Vertex AI 資源的中繼資料和層面,請參閱知識目錄中的「管理層面及豐富中繼資料」。