本文档介绍了 Sensitive Data Protection 的图片检查和隐去功能。
Sensitive Data Protection 使用 infoType 检测器检查 base64 编码的图片,并检测图片中的敏感数据 。然后,Sensitive Data Protection 可以返回有关图片内敏感数据位置的信息,或使用不透明的矩形遮盖发现的敏感数据,将其隐去。
检查和隐去是两个不同的操作:
- 检查:Sensitive Data Protection 会检查所提交的 base64 编码的图片中是否存在指定的 infoType。它会返回检测到的 InfoType,以及一组或多组像素坐标和维度。 每组像素坐标和维度值分别表示边界框的左下角和维度。每个边界框对应全部或部分的 Sensitive Data Protection 发现结果。
- 隐去:Sensitive Data Protection 会检查所提交的 base64 编码的图片中是否存在指定的 infoType。Sensitive Data Protection 会使用不透明的矩形遮盖发现的所有敏感数据以将其隐去。 它会返回隐去了敏感数据的 base64 编码的图片,采用与原始图片相同的格式。您还可以在请求中配置隐去框的颜色。
关于图片检查
Sensitive Data Protection 检查服务接受 base64 编码的图片,然后在图片中搜索匹配其检查条件的任何数据。Sensitive Data Protection 会返回检测到的任何敏感数据的位置。
请看以下图片。
图片检查流程如下:
- 您向
content.inspect请求发送到 DLP API。该请求包含 base64 编码的 图片和检查配置,其中包含您的检测 条件。 - Sensitive Data Protection 使用 检查配置扫描图片,并识别出所有匹配项。
- Sensitive Data Protection 会返回根据您的 检测条件找到的图片中敏感数据的 区域坐标和维度。
返回的坐标指示找到敏感数据的位置。请注意,Sensitive Data Protection 通常使用多个框来指示图片内单个敏感数据实例的位置。
如果 Sensitive Data Protection 未在图片中找到与您的检测条件相匹配的任何数据,则返回空的 HTTP 200 响应。
关于图片隐去
图片隐去与图片检查类似,但多了一个步骤。Sensitive Data Protection 识别出图片中敏感数据的位置后,会填充图片的相应区域,并返回已进行隐去处理的 base64 编码的图片,而不是返回数据所在位置的坐标。
图片隐去流程如下:
- 您向 DLP API 发送
image.redact请求 。该请求包含 base64 编码的图片 和图片隐去配置,其中包含您的检测 条件。 - Sensitive Data Protection 使用 图片隐去配置扫描图片,并识别出所有匹配项。
- Sensitive Data Protection 会使用不透明的矩形隐去检测到的所有敏感数据。然后,它会对图片进行 base64 编码 ,并在请求响应中返回隐去了敏感数据的图片。
如果 Sensitive Data Protection 未在图片中找到与您的检测条件相匹配的任何数据,则会返回 base64 编码的相同图片。
图片检测功能
本部分介绍了可应用于检查和隐去操作的图片检测功能。对于所有这些功能,您都需要执行 扫描,在支持图片 扫描的位置。
识别图片中的文本
Sensitive Data Protection 使用光学字符识别 (OCR) 功能检测图片中的文本。Sensitive Data Protection 分析检测到的文本的方式与分析文本块的方式类似。
如需检测图片中的文本,请在检查或隐去配置中指定任何基于文本的 infoType,例如 PERSON_NAME 和 CREDIT_CARD_NUMBER。
识别图片中的对象和主题
Sensitive Data Protection 可以分析主要不是基于文本的图片的像素和特征。Sensitive Data Protection 将此技术用于以下功能。
对象检测
Sensitive Data Protection 可以对图片中的对象进行分类和隐去。 例如,您可以将扫描配置为检测图片中的身份证件照片、人物和车牌。
如需检测图片中的对象,请在 检查或隐去配置中指定对象 infoType。
如需了解详情,请参阅以下内容:
图片安全分类
Sensitive Data Protection 可以根据图片的主题内容对图片进行分类和隐去。此功能有助于您根据预定义的安全类别识别包含敏感或有害主题的图片。
Sensitive Data Protection 会分析图片的整体背景信息和含义,以确定图片是否属于露骨色情或暴力内容等类别。您可以使用此功能来支持内容审核并强制执行可接受的使用政策。
执行图片安全分类时,Sensitive Data Protection 会分析整个图片。与识别图片中特定项的对象检测不同,此功能会评估图片的整体主题。如果您根据图片安全配置隐去,此功能会隐去整个图片。
如需执行图片安全分类,请在 检查或隐去配置中指定图片背景 信息 infoType。
生成图片的限制
Sensitive Data Protection 用于 图片安全分类 的模型主要是在真实图片上进行训练和评估的。 虽然这些模型可以为分析 AI 生成的图片提供一些价值,但它们在检测 AI 生成的图片中所有类型的违规内容方面的有效性可能会有所不同。
如果您对 AI 生成的图片使用 图片背景信息 infoType ,则可能无法检测到以下内容:
- 细微或微妙的内容
- 依赖于背景信息的场景,例如私密设置
- 对敏感主题的非血腥描绘
这些分类器在 AI 生成的图片上的表现可能与在自然图片上的表现不同。我们建议您针对特定的生成式 AI 使用场景进行全面测试,以确保结果符合您的安全要求。在高风险生成式 AI 应用中,请勿仅依赖这些分类器来确保安全。
后续步骤
- 了解如何使用 Sensitive Data Protection 检查图片中是否存在敏感数据。
- 了解如何使用 Sensitive Data Protection隐去图片中的敏感数据。
- 详细了解如何在存储空间中 创建数据的去标识化副本。