Présentation de la création d'ensembles de données gérés sur Vertex AI

Vous pouvez utiliser un ensemble de données géré pour fournir les données source servant à entraîner les modèles AutoML et personnalisés sur Vertex AI. Un ensemble de données géré est requis pour AutoML et facultatif pour l'entraînement personnalisé.

Autorisations et contrôle des accès

Lorsque vous utilisez des données d'un bucket Cloud Storage pour créer un ensemble de données, Vertex AI nécessite des autorisations pour accéder aux données. Vertex AI utilise un compte de service spécial géré par Google, appelé "agent de service", pour accéder à vos données de manière sécurisée. Pour en savoir plus sur les rôles requis et sur le fonctionnement de l'agent de service, consultez Contrôle des accès avec IAM.

Créer un ensemble de données géré pour les modèles AutoML

Vous pouvez créer des ensembles de données gérés pour l'entraînement de modèles AutoML à l'aide de la consoleGoogle Cloud ou de l'API Vertex AI. Les instructions pour y parvenir diffèrent légèrement suivant le type de données et l'objectif du modèle. Commencez par préparer vos données d'entraînement.

Image

Découvrez comment créer un ensemble de données géré pour les types de modèles d'images AutoML suivants :

Tabulaire

Découvrez comment créer un ensemble de données géré pour les types de modèles tabulaires AutoML suivants :

Vidéo

Découvrez comment créer un ensemble de données géré pour les types de modèles de vidéos AutoML suivants :

Créer un ensemble de données géré pour les modèles entraînés personnalisés

Les instructions de création d'un ensemble de données géré pour l'entraînement de modèles personnalisés sont identiques, quels que soient le type de données ou l'objectif du modèle.

Pour en savoir plus, consultez la page Utiliser des ensembles de données gérés.

Afficher les ensembles de données gérés à l'aide de Data Catalog

Data Catalog est un service de gestion des métadonnées entièrement géré et évolutif. Il fournit un emplacement centralisé pour rechercher des ensembles de données dans plusieurs projets et régions.

Pour en savoir plus, consultez Utiliser Data Catalog pour rechercher des ressources de modèles et d'ensembles de données.