Membuat pendeteksi label metadata kustom

Anda dapat mengonfigurasi Sensitive Data Protection untuk mendeteksi label metadata tertentu dalam konten Anda. Metadata dapat diekstrak secara otomatis dari jenis file yang didukung atau disediakan oleh aplikasi Anda dalam permintaan pemeriksaan. Jika Perlindungan Data Sensitif menemukan konten yang cocok dengan kriteria metadata Anda, Perlindungan Data Sensitif akan membuat temuan.

Untuk memindai label metadata, buat infoType label metadata kustom. Kemudian, konfigurasi pemindaian penemuan atau inspeksi Anda untuk menelusuri infoType tersebut.

Manfaat dan kasus penggunaan

Fitur ini memungkinkan Anda menggunakan taksonomi klasifikasi yang ada untuk pemeriksaan dan penegakan kebijakan. Jika Anda menggunakan sistem klasifikasi kustom atau pihak ketiga yang menerapkan label metadata ke dokumen, Anda dapat mengonfigurasi Perlindungan Data Sensitif untuk mendeteksi label metadata ini selama operasi inspeksi atau penemuan Anda.

Contoh kasus penggunaan mencakup:

  • Memindai file untuk mengetahui keberadaan label sensitivitas Microsoft yang berisi key-value pair tertentu.
  • Gabungkan deteksi label metadata dengan deteksi infoType standar untuk pendekatan berlapis-lapis.
  • Memindai metadata yang diteruskan bersama konten oleh aplikasi Anda, meskipun metadata tidak disematkan dalam file.
  • Menghapus informasi sensitif dari dokumen menggunakan Model Armor berdasarkan label metadata tertentu. Untuk menggunakan fitur ini dengan Model Armor—atau layanan yang menggunakan Model Armor seperti Gemini Enterprise—Anda harus membuat konfigurasi Sensitive Data Protection lanjutan di Model Armor yang mereferensikan detektor label metadata kustom ini.

Jenis file yang didukung

  • DOCX
  • PDF
  • PPTX
  • XLSX

Format metadata yang didukung

Fitur ini dapat mendeteksi metadata Microsoft Purview Information Protection dan metadata yang disediakan klien.

Metadata Microsoft Purview Information Protection

Fitur ini dapat mendeteksi metadata Microsoft Purview Information Protection yang memiliki format nama berikut:

MSIP_Label_GUID_ATTRIBUTE

Ganti kode berikut:

  • GUID: ID unik global metadata.
  • ATTRIBUTE: Atribut Microsoft Information Protection dari metadata. Nilai yang diterima:

    • ActionId
    • ContentBits
    • Enabled
    • Method
    • Name
    • SetDate
    • SiteId

Metadata yang disediakan klien

Anda dapat memberikan metadata kustom langsung dalam permintaan InspectContent. Metadata yang disediakan klien adalah daftar pasangan nilai kunci yang diteruskan di kolom ContentMetadata dari ContentItem.

Batasan

infoType kustom jenis MetadataKeyValueExpression tidak didukung dalam hal berikut:

Membuat pendeteksi infoType kustom label metadata

Untuk membuat detektor infoType kustom label metadata, tentukan CustomInfoType berjenis MetadataKeyValueExpression dalam objek InspectConfig. Objek CustomInfoType memiliki properti berikut:

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_METADATA_LABEL_NAME"
        },
        "likelihood": "LIKELIHOOD",
        "sensitivityScore":{
          "score": "SENSITIVITY_SCORE"
        },
        "metadata_key_value_expression": {
          "key_regex": "KEY_REGULAR_EXPRESSION",
          "value_regex": "VALUE_REGULAR_EXPRESSION"
        }
      }
    ]
  }
}

Ganti kode berikut:

  • CUSTOM_METADATA_LABEL_NAME: Nama yang akan ditetapkan ke detektor infoType kustom.
  • LIKELIHOOD: (Opsional) Nilai Likelihood yang akan ditetapkan ke semua temuan yang cocok dengan infoType kustom ini. Jika Anda menghapus kolom ini, tingkat kemungkinan defaultnya adalah VERY_LIKELY.
  • SENSITIVITY_SCORE: (Opsional) SensitivityScore yang akan ditetapkan ke semua temuan yang cocok dengan infoType kustom ini. Jika Anda menghapus kolom ini, skor sensitivitas default adalah HIGH.

    Skor sensitivitas digunakan dalam profil data. Saat membuat profil data Anda, Sensitive Data Protection menggunakan skor sensitivitas infoType untuk menghitung tingkat sensitivitas.

  • KEY_REGULAR_EXPRESSION: Ekspresi reguler untuk menelusuri kunci label metadata.

  • VALUE_REGULAR_EXPRESSION: Ekspresi reguler untuk menelusuri nilai label metadata.

Contoh detektor untuk label sensitivitas Microsoft

Contoh inspect_config ini menentukan infoType kustom bernama CUSTOM_MIP_HIGHLY_CONFIDENTIAL. infoType kustom ini mendeteksi label Microsoft Purview Information Protection yang berisi GUID 12345678-9012-3456-7890-123456789012 dan diaktifkan:

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_HIGHLY_CONFIDENTIAL"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled",
          "value_regex": "true"
        }
      }
    ],
    "min_likelihood": "POSSIBLE"
  }
}

Saat Anda menggunakan konfigurasi ini dalam tugas inspeksi, Sensitive Data Protection akan membuat temuan CUSTOM_MIP_HIGHLY_CONFIDENTIAL jika menemukan konten dengan kunci metadata MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled yang memiliki nilai true.

Memindai metadata yang disediakan klien

Untuk memindai label metadata yang disediakan klien, ikuti langkah-langkah berikut:

  1. Buat pendeteksi infoType label metadata kustom.
  2. Sertakan metadata yang ingin Anda pindai di kolom ContentMetadata pada ContentItem.

Contoh permintaan untuk memindai metadata yang disediakan klien

Contoh berikut menunjukkan permintaan InspectContent yang menyertakan file PDF dan metadata yang disediakan klien. Permintaan ini menggunakan infoType kustom bernama CUSTOM_MIP_CONFIDENTIAL_INTERNAL_USE untuk memindai file dan metadata yang diberikan untuk file yang ditandai sebagai "Rahasia" atau "Penggunaan Internal".

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_CONFIDENTIAL_INTERNAL_USE"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_.*_Name",
          "value_regex": "Confidential|Internal Use"
        }
      }
    ]
  },
  "item": {
    "byte_item": {
      "type": "PDF",
      "data": "BASE64_ENCODED_PDF"
    },
    "content_metadata": {
      "properties": [
        {
          "key": "MSIP_Label_174b6716-c2ea-4041-b631-5633733fbe46_Name",
          "value": "Confidential"
        }
      ]
    }
  }
}

Ganti BASE64_ENCODED_PDF dengan file berenkode base64 yang akan dipindai.

Jika Sensitive Data Protection menemukan kecocokan dalam metadata yang disediakan klien, MetadataType temuan untuk MetadataLocation adalah CLIENT_PROVIDED_METADATA. Jika kecocokan ada di metadata yang diekstrak dari file, seperti label MSIP, nilainya adalah CONTENT_METADATA.

MetadataType untuk MetadataLocation diisi berdasarkan apakah kecocokan ada dalam metadata yang diekstrak dari file atau yang disediakan klien.

Langkah berikutnya