맞춤 메타데이터 라벨 감지기 만들기

콘텐츠에서 특정 메타데이터 라벨을 감지하도록 민감한 정보 보호를 구성할 수 있습니다. 메타데이터는 지원되는 파일 유형에서 자동으로 추출되거나 검사 요청에서 애플리케이션에 의해 제공될 수 있습니다. Sensitive Data Protection이 메타데이터 기준과 일치하는 콘텐츠를 찾으면 발견 항목을 생성합니다.

메타데이터 라벨을 검색하려면 커스텀 메타데이터 라벨 infoType을 만드세요. 그런 다음 해당 infoType을 검색하도록 검사 또는 검색 스캔을 구성합니다.

장점 및 사용 사례

이 기능을 사용하면 검사 및 정책 시행에 기존 분류 분류를 사용할 수 있습니다. 문서에 메타데이터 라벨을 적용하는 맞춤 또는 서드 파티 분류 시스템을 사용하는 경우 검사 또는 검색 작업 중에 이러한 메타데이터 라벨을 감지하도록 민감한 정보 보호를 구성할 수 있습니다.

사용 사례의 예는 다음과 같습니다.

  • 특정 키-값 쌍이 포함된 Microsoft 민감도 라벨의 존재 여부를 파일에서 검색합니다.
  • 다층적 접근 방식을 위해 메타데이터 라벨 감지와 표준 infoType 감지를 결합합니다.
  • 메타데이터가 파일에 삽입되지 않은 경우에도 애플리케이션에서 콘텐츠와 함께 전달되는 메타데이터를 검사합니다.
  • 특정 메타데이터 라벨을 기반으로 Model Armor를 사용하여 문서를 정리합니다. Model Armor 또는 Gemini Enterprise와 같이 Model Armor를 사용하는 서비스에서 이 기능을 사용하려면 이 맞춤 메타데이터 라벨 감지기를 참조하는 Model Armor에서 고급 Sensitive Data Protection 구성을 만들어야 합니다.

지원되는 파일 형식

  • DOCX
  • PDF
  • PPTX
  • XLSX

지원되는 메타데이터 형식

이 기능은 Microsoft Purview Information Protection 메타데이터와 클라이언트 제공 메타데이터를 감지할 수 있습니다.

Microsoft Purview 정보 보호 메타데이터

이 기능은 다음 이름 형식을 갖는 Microsoft Purview Information Protection 메타데이터를 감지할 수 있습니다.

MSIP_Label_GUID_ATTRIBUTE

다음을 바꿉니다.

  • GUID: 메타데이터의 전역적으로 고유한 식별자입니다.
  • ATTRIBUTE: 메타데이터의 Microsoft 정보 보호 속성입니다. 허용되는 값은 다음과 같습니다.

    • ActionId
    • ContentBits
    • Enabled
    • Method
    • Name
    • SetDate
    • SiteId

클라이언트 제공 메타데이터

InspectContent 요청에서 직접 맞춤 메타데이터를 제공할 수 있습니다. 클라이언트 제공 메타데이터는 ContentItemContentMetadata 필드에 전달되는 키-값 쌍의 목록입니다.

제한사항

다음에서는 MetadataKeyValueExpression 유형의 맞춤 infoType이 지원되지 않습니다.

메타데이터 라벨 커스텀 infoType 감지기 만들기

메타데이터 라벨 커스텀 infoType 감지기를 만들려면 InspectConfig 객체 내에 MetadataKeyValueExpression 유형의 CustomInfoType를 정의합니다. CustomInfoType 객체에는 다음과 같은 속성이 있습니다.

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_METADATA_LABEL_NAME"
        },
        "likelihood": "LIKELIHOOD",
        "sensitivityScore":{
          "score": "SENSITIVITY_SCORE"
        },
        "metadata_key_value_expression": {
          "key_regex": "KEY_REGULAR_EXPRESSION",
          "value_regex": "VALUE_REGULAR_EXPRESSION"
        }
      }
    ]
  }
}

다음을 바꿉니다.

  • CUSTOM_METADATA_LABEL_NAME: 커스텀 infoType 감지기에 할당할 이름입니다.
  • LIKELIHOOD: (선택사항) 이 맞춤 infoType과 일치하는 모든 결과에 할당할 Likelihood 값입니다. 이 필드를 생략하면 기본 가능성 수준은 VERY_LIKELY입니다.
  • SENSITIVITY_SCORE: (선택사항) 이 맞춤 infoType과 일치하는 모든 결과에 할당할 SensitivityScore입니다. 이 필드를 생략하면 기본 민감도 점수는 HIGH입니다.

    민감도 점수는 데이터 프로필에서 사용됩니다. 데이터를 프로파일링할 때 Sensitive Data Protection은 infoTypes의 민감도 점수를 사용하여 민감도 수준을 계산합니다.

  • KEY_REGULAR_EXPRESSION: 메타데이터 라벨의 키에서 검색할 정규 표현식입니다.

  • VALUE_REGULAR_EXPRESSION: 메타데이터 라벨의 값에서 검색할 정규 표현식입니다.

Microsoft 민감도 라벨의 감지기 예

inspect_config 예시에서는 CUSTOM_MIP_HIGHLY_CONFIDENTIAL이라는 커스텀 infoType을 정의합니다. 이 맞춤 infoType은 GUID 12345678-9012-3456-7890-123456789012가 포함되고 사용 설정된 Microsoft Purview Information Protection 라벨을 감지합니다.

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_HIGHLY_CONFIDENTIAL"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled",
          "value_regex": "true"
        }
      }
    ],
    "min_likelihood": "POSSIBLE"
  }
}

검사 작업에서 이 구성을 사용하면 메타데이터 키 MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled의 값이 true인 콘텐츠가 발견될 경우 Sensitive Data Protection에서 CUSTOM_MIP_HIGHLY_CONFIDENTIAL 결과를 생성합니다.

클라이언트 제공 메타데이터 스캔

클라이언트 제공 메타데이터 라벨을 검색하려면 다음 단계를 따르세요.

  1. 맞춤 메타데이터 라벨 infoType 감지기를 만듭니다.
  2. ContentItemContentMetadata 필드에 스캔할 메타데이터를 포함합니다.

클라이언트 제공 메타데이터 스캔 요청의 예

다음 예에서는 PDF 파일과 클라이언트 제공 메타데이터가 모두 포함된 InspectContent 요청을 보여줍니다. 이 요청은 CUSTOM_MIP_CONFIDENTIAL_INTERNAL_USE라는 맞춤 infoType을 사용하여 파일과 제공된 메타데이터를 모두 스캔하여 '기밀' 또는 '내부용'으로 표시된 파일을 찾습니다.

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_CONFIDENTIAL_INTERNAL_USE"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_.*_Name",
          "value_regex": "Confidential|Internal Use"
        }
      }
    ]
  },
  "item": {
    "byte_item": {
      "type": "PDF",
      "data": "BASE64_ENCODED_PDF"
    },
    "content_metadata": {
      "properties": [
        {
          "key": "MSIP_Label_174b6716-c2ea-4041-b631-5633733fbe46_Name",
          "value": "Confidential"
        }
      ]
    }
  }
}

BASE64_ENCODED_PDF을 스캔할 base64로 인코딩된 파일로 바꿉니다.

Sensitive Data Protection에서 클라이언트가 제공한 메타데이터에서 일치하는 항목을 찾으면 MetadataLocation의 감지 결과 MetadataTypeCLIENT_PROVIDED_METADATA입니다. 일치하는 항목이 파일에서 추출한 메타데이터(예: MSIP 라벨)에 있는 경우 값은 CONTENT_METADATA입니다.

MetadataLocationMetadataType는 일치가 파일에서 추출된 메타데이터에 있는지 아니면 클라이언트에서 제공한 메타데이터에 있는지에 따라 채워집니다.

다음 단계