カスタム メタデータ ラベル検出器を作成する

コンテンツ内の特定のメタデータ ラベルを検出するように Sensitive Data Protection を構成できます。Sensitive Data Protection は、メタデータ基準に一致するコンテンツを検出すると、検出結果を生成します。

メタデータ ラベルをスキャンするには、カスタム メタデータ ラベルの infoType を作成します。次に、その infoType を検索するように検査または検出スキャンを構成します。

利点と使用例

この機能を使用すると、既存の分類タクソノミーを検査とポリシーの適用に使用できます。ドキュメントにメタデータ ラベルを適用するカスタムまたはサードパーティの分類システムを使用している場合は、検査または検出オペレーション中にこれらのメタデータ ラベルを検出するように Sensitive Data Protection を構成できます。

使用例には、次のようなものがあります。

  • 特定の Key-Value ペアを含む Microsoft の機密ラベルの有無をファイルでスキャンします。
  • メタデータ ラベルに基づいて Gemini Enterprise でファイルをブロックまたは許可します。
  • メタデータ ラベル検出と標準の InfoType 検出を組み合わせて、多層アプローチを実現します。

サポートされているファイル形式

  • DOCX
  • PDF
  • PPTX
  • XLSX

サポートされているメタデータ形式

この機能は、次の名前形式の Microsoft Purview 情報保護メタデータを検出できます。

MSIP_Label_GUID_ATTRIBUTE

次のように置き換えます。

  • GUID: メタデータのグローバル一意識別子。
  • ATTRIBUTE: メタデータの Microsoft Information Protection 属性。指定可能な値は次のとおりです。

    • ActionId
    • ContentBits
    • Enabled
    • Method
    • Name
    • SetDate
    • SiteId

制限事項

次のものでは、MetadataKeyValueExpression タイプのカスタム infoType はサポートされていません。

メタデータ ラベルのカスタム infoType 検出器を作成する

メタデータ ラベルのカスタム infoType 検出器を作成するには、InspectConfig オブジェクト内で MetadataKeyValueExpression タイプの CustomInfoType を定義します。CustomInfoType オブジェクトには次のプロパティがあります。

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_METADATA_LABEL_NAME"
        },
        "likelihood": "LIKELIHOOD",
        "sensitivityScore":{
          "score": "SENSITIVITY_SCORE"
        },
        "metadata_key_value_expression": {
          "key_regex": "KEY_REGULAR_EXPRESSION",
          "value_regex": "VALUE_REGULAR_EXPRESSION"
        }
      }
    ]
  }
}

次のように置き換えます。

  • CUSTOM_METADATA_LABEL_NAME: カスタム infoType 検出器に割り当てる名前。
  • LIKELIHOOD:(省略可)このカスタム infoType に一致するすべての検出結果に割り当てる Likelihood 値。このフィールドを省略すると、デフォルトの可能性レベルは VERY_LIKELY になります。
  • SENSITIVITY_SCORE:(省略可)このカスタム infoType に一致するすべての検出結果に割り当てる SensitivityScore。このフィールドを省略すると、デフォルトの機密性スコアは HIGH になります。

    機密性スコアはデータ プロファイルで使用されます。データのプロファイリング時に、機密データの保護は、infoType の機密性スコアを使用して機密性レベルを計算します。

  • KEY_REGULAR_EXPRESSION: メタデータ ラベルのキーで検索する正規表現。

  • VALUE_REGULAR_EXPRESSION: メタデータ ラベルの値で検索する正規表現。

Microsoft 秘密度ラベルの検出項目の例

この inspect_config の例では、CUSTOM_MIP_HIGHLY_CONFIDENTIAL という名前のカスタム infoType を定義しています。このカスタム infoType は、GUID 12345678-9012-3456-7890-123456789012 を含み、有効になっている Microsoft Purview Information Protection ラベルを検出します。

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_HIGHLY_CONFIDENTIAL"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled",
          "value_regex": "true"
        }
      }
    ],
    "min_likelihood": "POSSIBLE"
  }
}

この構成を検査ジョブで使用すると、メタデータキー MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled の値が true であるコンテンツが見つかった場合、Sensitive Data Protection は CUSTOM_MIP_HIGHLY_CONFIDENTIAL の検出結果を生成します。