Cette page décrit la découverte Sensitive Data Protection à utiliser avec Vertex AI.
La découverte Sensitive Data Protection vous aide à en savoir plus sur les données incluses dans vos ensembles de données d'entraînement et vos jobs de réglage Vertex AI. La découverte génère des profils de données qui fournissent des informations telles que les types d'informations (infoTypes) détectés et le niveau de sensibilité des données que vous utilisez pour entraîner et ajuster les modèles.
Avantages
Cette fonctionnalité présente les avantages suivants :
- Vous pouvez surveiller vos ensembles de données et vos jobs d'ajustement Vertex AI au niveau de l'organisation, du dossier ou du projet pour détecter les données sensibles, et générer des rapports sur les résultats.
- Si la découverte détecte des données d'entraînement ou d'ajustement sensibles, vous pouvez utiliser les profils de données pour identifier les ressources qui doivent faire l'objet d'une enquête plus approfondie. Vous pouvez effectuer une inspection approfondie et trouver toutes les instances sensibles dans une ressource.
- Vous pouvez envoyer les résultats de la découverte à Security Command Center afin que vos charges de travail liées à l'IA et contenant potentiellement des données sensibles soient prises en compte lorsque vous évaluez la stratégie de sécurité de votre organisation.
Source de données acceptée
Cette fonctionnalité peut profiler les types de données suivants référencés dans vos ensembles de données et jobs de réglage Vertex AI :
- Données d'entraînement et de réglage dans des buckets Cloud Storage. Pour en savoir plus sur les types de fichiers acceptés, consultez Clusters de fichiers.
- Données d'entraînement dans les tables BigQuery.
Fonctionnement
Lorsque vous profilez un ensemble de données Vertex AI, la protection des données sensibles génère un profil de données de fichier store ou un profil de données de table, selon l'emplacement de stockage des données d'entraînement : un bucket Cloud Storage ou une table BigQuery.
Lorsque vous profilez un job de réglage Vertex AI, Sensitive Data Protection génère un profil de données de fichier store.
Un profil de données fournit des insights et des métadonnées sur la ressource que vous avez profilée. Pour chaque ensemble de données ou job de réglage Vertex AI, le profil de données généré inclut les informations suivantes.
- Niveaux de sensibilité et de risque liés aux données d'entraînement ou de réglage
- Les types d'informations sensibles trouvées dans les données d'entraînement ou d'ajustement (par exemple, les numéros de permis de conduire et les adresses e-mail)
Pour obtenir la liste complète des insights et des métadonnées dans chaque profil de données du magasin de fichiers, consultez Profils de données du magasin de fichiers.
Pour obtenir la liste complète des insights et des métadonnées dans chaque profil de données de table, consultez Profils de données de table.
Pour en savoir plus sur le service de découverte, consultez Profils de données.
Tarifs
Lorsque vous profilez des données, vous êtes facturé par Sensitive Data Protection en fonction du mode de tarification de la découverte que vous avez choisi.
De plus, si vos données d'entraînement ou de réglage se trouvent dans un bucket Cloud Storage, Cloud Storage vous facture les requêtes que Sensitive Data Protection effectue pour profiler les données. Les sections suivantes décrivent les frais Cloud Storage associés que vous devrez payer.
Opérations de classe B
Les opérations de classe B (storage.buckets.get) effectuées par la protection des données sensibles lors du profilage des données dans vos buckets Cloud Storage vous sont facturées.
Pour en savoir plus sur les frais facturés par Cloud Storage pour les opérations de classe B, consultez la section Frais d'opération de la documentation Cloud Storage.
Frais de récupération
Pour les objets dont la classe de stockage n'est pas "Standard", des frais de récupération vous sont facturés. Pour en savoir plus sur les frais de récupération de données facturés par Cloud Storage, consultez Frais de récupération dans la documentation Cloud Storage.
Étapes suivantes
- Profiler les données Vertex AI dans un seul projet
- Profiler des données Vertex AI dans une organisation ou un dossier