画像の検査と秘匿化

このドキュメントでは、Sensitive Data Protection の画像検査と秘匿化の機能について説明します。

機密データの保護は、infoType 検出器を使用して、Base64 でエンコードされた画像を検査し、画像内の機密データを検出します。それから、画像内の機密データの場所に関する情報を返すか、不透明な長方形で機密データをマスキングすることで秘匿化します。

検査と秘匿化は 2 つの異なるオペレーションです。

  • 検査: 機密データの保護は、指定された infoType について、送信された Base64 エンコード画像を検査します。そして、検出された infoType と、1 つ以上のピクセル座標と寸法のセットを返します。ピクセル座標値と寸法値のセットは、それぞれ境界ボックスの左下隅の座標と寸法を示します。各境界ボックスは、機密データの保護の検出結果のすべてまたは一部に対応します。
  • 秘匿化: 機密データの保護は、指定された infoType について、送信された Base64 エンコード画像を検査します。機密データの保護は、見つかった機密データを不透明な長方形でマスキングすることで秘匿化します。秘匿化された Base64 エンコード画像は、元の画像と同じ画像形式で返されます。秘匿化のボックスの色をリクエストで構成することもできます。

画像検査について

Sensitive Data Protection 検査サービスは、Base64 エンコードされた画像を受け取り、検査基準に一致するデータを画像内で検索します。Sensitive Data Protection は、検出された機密データの場所を返します。

次の画像について考えてみましょう。

デリケートなオブジェクトを含む元の画像。
元の画像(クリックして拡大)。

画像検査プロセスは次のとおりです。

  1. DLP API に content.inspect リクエストを送信します。リクエストには、Base64 エンコードされた画像と検査構成が含まれています。検査構成には、検出条件が含まれています。
  2. Sensitive Data Protection は、検査構成を使用して画像をスキャンし、一致するものを識別します。
  3. 機密データの保護は、検出基準に従って機密データを検出した画像内の領域の座標と寸法を返します。

返された座標は、機密データがある場所を示します。機密データの保護では、1 つの機密データのインスタンスが画像内のどこにあるかを示すために、複数のボックスが使われることが多いことに注意してください。

検出基準に一致する画像内のデータが機密データの保護で見つからない場合、空の正常な HTTP 200 レスポンスが返されます。

画像の秘匿化について

画像の秘匿化は画像の検査と同じ手順ですが、1 つ追加の手順があります。機密データの保護は、画像内の機密データの場所を特定すると、データを含む領域の座標を返すのではなく、その領域に不透明な長方形を配置し、秘匿化した Base64 エンコード画像を返します。

機密データが隠された秘匿化された画像。
秘匿化された画像(クリックして拡大)。

画像編集のプロセスは次のとおりです。

  1. DLP API に image.redact リクエストを送信します。リクエストには、Base64 でエンコードされた画像と、検出基準を含む画像秘匿化構成が含まれています。
  2. Sensitive Data Protection は、画像秘匿化構成を使用して画像をスキャンし、一致するものを識別します。
  3. 機密データの保護は、検出した機密データをすべて不透明な長方形でカバーすることで秘匿化します。次に、画像を Base64 でエンコードし、リクエスト レスポンスで秘匿化された画像を返します。

検出基準に一致する画像内のデータが機密データの保護で見つからない場合は、Base64 エンコード画像が変更されずに返されます。

画像検出機能

このセクションでは、検査と編集のオペレーションに適用できる画像検出機能について説明します。これらの機能を使用するには、画像スキャンをサポートする場所でスキャンを行う必要があります。

画像内のテキストを認識する

機密データの保護は、光学式文字認識(OCR)を使用して画像内のテキストを検出します。機密データの保護は、検出されたテキストを本文の分析と同様の方法で分析します。

画像内のテキストを検出するには、検査または秘匿化の構成で、PERSON_NAMECREDIT_CARD_NUMBER などのテキストベースの infoType を指定します。

画像内のオブジェクトとテーマを認識する

Sensitive Data Protection は、主にテキストベースではない画像のピクセルと特徴を分析できます。Sensitive Data Protection は、次の機能でこの手法を使用します。

オブジェクト検出

Sensitive Data Protection は、画像内のオブジェクトを分類して修正できます。たとえば、画像内の身分証明書、人物、ナンバープレートを検出するようにスキャンを構成できます。

画像内のオブジェクトを検出するには、検査または編集の構成で オブジェクトの infoType を指定します。

詳しくは以下をご覧ください。

画像の安全性分類

Sensitive Data Protection は、テーマ コンテンツに基づいて画像を分類し、修正できます。この機能は、事前定義された安全カテゴリに基づいて、機密性の高いまたは有害な主題を含む画像を特定するのに役立ちます。

機密データの保護は、画像全体のコンテキストと意味を分析して、性的描写が露骨なコンテンツや暴力的なコンテンツなどのカテゴリに属するかどうかを判断します。この機能を使用すると、コンテンツのモデレーションをサポートし、利用規約を適用できます。

画像安全性の分類を行う場合、機密データの保護は画像全体を分析します。画像内の特定のアイテムを識別するオブジェクト検出とは異なり、この機能は画像の内容全体を評価します。画像安全性に基づいて秘匿化を構成すると、この機能は画像全体を秘匿化します。

画像の安全性の分類を行うには、検査または秘匿化の構成で画像コンテキストの infoType を指定します。

次のステップ