Vous pouvez utiliser un ensemble de données géré pour fournir les données source servant à entraîner les modèles AutoML et personnalisés sur Vertex AI. Un ensemble de données géré est requis pour AutoML et facultatif pour l'entraînement personnalisé.
Autorisations et contrôle des accès
Lorsque vous utilisez des données d'un bucket Cloud Storage pour créer un ensemble de données, Vertex AI a besoin d'autorisations pour accéder aux données. Vertex AI utilise un compte de service spécial géré par Google, appelé "agent de service", pour accéder à vos données de manière sécurisée. Pour en savoir plus sur les rôles requis et sur le fonctionnement de l'agent de service, consultez Contrôle des accès avec IAM.
Créer un ensemble de données géré pour les modèles AutoML
Vous pouvez créer des ensembles de données gérés pour l'entraînement de modèles AutoML à l'aide de la consoleGoogle Cloud ou de l'API Vertex AI. Les instructions pour y parvenir diffèrent légèrement suivant le type de données et l'objectif du modèle. Commencez par préparer vos données d'entraînement.
Image
Découvrez comment créer un ensemble de données géré pour les types de modèles d'images AutoML suivants :
Tabulaire
Découvrez comment créer un ensemble de données géré pour les types de modèles tabulaires AutoML suivants :
Créer un ensemble de données géré pour les modèles entraînés personnalisés
Les instructions de création d'un ensemble de données géré pour l'entraînement de modèles personnalisés sont identiques, quels que soient le type de données ou l'objectif du modèle.
Pour en savoir plus, consultez la page Utiliser des ensembles de données gérés.
Afficher les ensembles de données gérés à l'aide de Dataplex Universal Catalog
Dataplex Universal Catalog est un service de gestion des métadonnées entièrement géré et évolutif. Il fournit un emplacement centralisé pour rechercher des ensembles de données dans plusieurs projets et régions. Il est intégré à Vertex AI et offre des fonctionnalités similaires à celles de Data Catalog, qui est obsolète.
Vous pouvez utiliser Dataplex Universal Catalog pour découvrir, comprendre et enrichir vos données avec des aspects (qui sont semblables aux tags Data Catalog).
Pour savoir comment gérer les métadonnées et les aspects de vos ressources Vertex AI, consultez Gérer les aspects et enrichir les métadonnées dans Dataplex Universal Catalog.