本页面介绍了如何将 Sensitive Data Protection 发现功能与 Vertex AI 搭配使用。
Sensitive Data Protection 发现功能可帮助您了解 Vertex AI 训练数据集和调优作业中包含的数据。 发现功能会生成数据分析文件,其中包含一些分析洞见,例如检测到的信息类型 (infoTypes) 以及用于训练和调整模型的数据的敏感度级别。
优势
此功能具有以下优势:
- 您可以监控组织、文件夹或项目级层的 Vertex AI 数据集和调优作业中是否存在敏感数据,并生成结果报告。
- 如果探索功能检测到敏感的训练数据或调优数据,您可以使用数据剖析来确定哪些资源需要进一步调查。您可以执行深度检查,并查找资源中的所有敏感实例。
- 您可以将发现结果发送到 Security Command Center,以便在评估组织的安全状况时,将可能包含敏感数据的 AI 相关工作负载纳入考虑范围。
支持的数据源
此功能可以分析 Vertex AI 数据集和调优作业中引用的以下类型的数据:
- Cloud Storage 存储分区中的训练和调优数据。如需了解支持的文件类型,请参阅文件聚类。
- BigQuery 表中的训练数据。
工作原理
当您分析 Vertex AI 数据集时,敏感数据保护会生成文件存储区数据剖析文件或表格数据剖析文件,具体取决于训练数据的存储位置:Cloud Storage 存储桶或 BigQuery 表。
对 Vertex AI 调优作业进行分析时,Sensitive Data Protection 会生成文件存储区数据分析。
数据分析文件可提供有关您分析的资源的分析洞见和元数据。对于每个 Vertex AI 数据集或调优作业,生成的数据分析包括以下信息。
- 训练数据或调优数据的敏感度和数据风险级别
- 训练数据或微调数据中发现的敏感信息类型,例如驾照 ID 和电子邮件地址
如需查看每个文件存储区数据分析文件中包含的分析洞见和元数据的完整列表,请参阅文件存储区数据分析。
如需查看每个表数据剖析文件中的所有数据洞见和元数据,请参阅表数据剖析文件。
如需详细了解发现服务,请参阅数据剖析。
价格
在分析数据时,您需要根据所选的发现价格模式支付 Sensitive Data Protection 费用。
此外,如果您的训练或调优数据位于 Cloud Storage 存储桶中,那么 Cloud Storage 会针对敏感数据保护功能为分析数据而发出的请求向您收取费用。以下各部分介绍了您需要支付的相关 Cloud Storage 费用。
B 类操作
您需要为 Sensitive Data Protection 在分析 Cloud Storage 存储分区中的数据时执行的 B 类 (storage.buckets.get) 操作付费。
如需了解 Cloud Storage 对 B 类操作的收费标准,请参阅 Cloud Storage 文档中的操作费用。
检索费用
对于具有非 Standard 存储类别的对象,您需要支付检索费用。如需了解 Cloud Storage 对数据检索收取的费用,请参阅 Cloud Storage 文档中的检索费用。