יצירת מזהה תוויות מותאם אישית של מטא נתונים

אתם יכולים להגדיר את Sensitive Data Protection כך שיזהה תוויות ספציפיות של מטא נתונים בתוכן שלכם. אפשר לחלץ את המטא-נתונים באופן אוטומטי מסוגי קבצים נתמכים, או לספק אותם באמצעות האפליקציה בבקשת הבדיקה. אם הכלי Sensitive Data Protection מוצא תוכן שתואם לקריטריונים של המטא-נתונים, הוא יוצר ממצא.

כדי לסרוק תוויות של מטא-נתונים, צריך ליצור סוג מידע של תוויות מטא-נתונים בהתאמה אישית. לאחר מכן, מגדירים את הסריקה של הבדיקה או הגילוי כך שתחפש את סוג המידע הזה.

יתרונות ותרחישי שימוש

התכונה הזו מאפשרת לכם להשתמש בטקסונומיות הסיווג הקיימות שלכם לצורך בדיקה ואכיפת מדיניות. אם אתם משתמשים במערכת סיווג מותאמת אישית או של צד שלישי שמחיל תוויות מטא-נתונים על המסמכים, אתם יכולים להגדיר את Sensitive Data Protection כך שהיא תזהה את תוויות המטא-נתונים האלה במהלך פעולות הבדיקה או הגילוי.

דוגמאות לתרחישי שימוש:

  • סריקת קבצים כדי לזהות תוויות רגישות של מיקרוסופט שמכילות צמדי מפתח-ערך ספציפיים.
  • משלבים זיהוי של תוויות מטא-נתונים עם זיהוי רגיל של סוגי מידע כדי ליצור גישה רב-שכבתית.
  • סריקת מטא-נתונים שמועברים לצד התוכן על ידי האפליקציה, גם אם המטא-נתונים לא מוטמעים בקובץ.
  • ניקוי מסמכים באמצעות Model Armor על סמך תוויות ספציפיות של מטא-נתונים. כדי להשתמש בתכונה הזו עם Model Armor – או עם שירותים שמשתמשים ב-Model Armor כמו Gemini Enterprise – צריך ליצור ב-Model Armor הגדרה מתקדמת של הגנה על נתונים רגישים שמפנה לגלאי התוויות המותאם אישית הזה של מטא-נתונים.

סוגי קבצים נתמכים

  • DOCX
  • PDF
  • PPTX
  • XLSX

פורמטים נתמכים של מטא-נתונים

התכונה הזו יכולה לזהות מטא-נתונים של Microsoft Purview Information Protection ומטא-נתונים שסופקו על ידי הלקוח.

מטא-נתונים של Microsoft Purview Information Protection

התכונה הזו יכולה לזהות מטא-נתונים של Microsoft Purview Information Protection בפורמט השם הבא:

MSIP_Label_GUID_ATTRIBUTE

מחליפים את מה שכתוב בשדות הבאים:

  • GUID: המזהה הייחודי הגלובלי של המטא-נתונים.
  • ATTRIBUTE: מאפיין Microsoft Information Protection של המטא-נתונים. ערכים מותרים:

    • ActionId
    • ContentBits
    • Enabled
    • Method
    • Name
    • SetDate
    • SiteId

מטא-נתונים שסופקו על ידי הלקוח

אפשר לספק מטא-נתונים בהתאמה אישית ישירות בבקשת InspectContent. מטא-נתונים שסופקו על ידי הלקוח הם רשימה של צמדי מפתח/ערך שמועברים בשדה ContentMetadata של ContentItem.

מגבלות

לא ניתן להשתמש בסוגי מידע מותאמים אישית מסוג MetadataKeyValueExpression במקרים הבאים:

יצירת מזהה מותאם אישית של סוג מידע עם תווית מטא נתונים

כדי ליצור גלאי מותאם אישית של Infotype לתווית מטא-נתונים, מגדירים CustomInfoType מסוג MetadataKeyValueExpression באובייקט InspectConfig. לאובייקט CustomInfoType יש את המאפיינים הבאים:

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_METADATA_LABEL_NAME"
        },
        "likelihood": "LIKELIHOOD",
        "sensitivityScore":{
          "score": "SENSITIVITY_SCORE"
        },
        "metadata_key_value_expression": {
          "key_regex": "KEY_REGULAR_EXPRESSION",
          "value_regex": "VALUE_REGULAR_EXPRESSION"
        }
      }
    ]
  }
}

מחליפים את מה שכתוב בשדות הבאים:

  • CUSTOM_METADATA_LABEL_NAME: השם שרוצים להקצות לגלאי המותאם אישית של סוג המידע.
  • LIKELIHOOD: (אופציונלי) הערך Likelihood שיוקצה לכל הממצאים שתואמים לסוג המידע המותאם אישית הזה. אם לא משמיטים את השדה הזה, רמת הסבירות שמוגדרת כברירת מחדל היא VERY_LIKELY.
  • SENSITIVITY_SCORE: (אופציונלי) SensitivityScore להקצאה לכל הממצאים שתואמים לסוג המידע המותאם אישית הזה. אם לא מציינים את השדה הזה, ציון הרגישות שמוגדר כברירת מחדל הוא HIGH.

    ציוני הרגישות משמשים בפרופילים של נתונים. כשמבצעים פרופיל לנתונים, Sensitive Data Protection משתמש בציוני הרגישות של ה-infoTypes כדי לחשב את רמת הרגישות.

  • KEY_REGULAR_EXPRESSION: ביטוי רגולרי לחיפוש במפתחות של תוויות מטא-נתונים.

  • VALUE_REGULAR_EXPRESSION: ביטוי רגולרי לחיפוש בערכים של תוויות מטא-נתונים.

דוגמה לגלאי של תווית רגישות של מיקרוסופט

בדוגמה הזו של inspect_config מוגדר infoType מותאם אישית בשם CUSTOM_MIP_HIGHLY_CONFIDENTIAL. סוג המידע המותאם אישית הזה מזהה תווית של Microsoft Purview Information Protection שמכילה את ה-GUID 12345678-9012-3456-7890-123456789012 ומופעלת:

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_HIGHLY_CONFIDENTIAL"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled",
          "value_regex": "true"
        }
      }
    ],
    "min_likelihood": "POSSIBLE"
  }
}

כשמשתמשים בהגדרה הזו בעבודת בדיקה, Sensitive Data Protection יוצר ממצא CUSTOM_MIP_HIGHLY_CONFIDENTIAL אם הוא מוצא תוכן שבו מפתח המטא-נתונים MSIP_Label_12345678-9012-3456-7890-123456789012_Enabled מקבל את הערך true.

סריקה של מטא-נתונים שסופקו על ידי הלקוח

כדי לסרוק תוויות מטא נתונים שסופקו על ידי הלקוח:

  1. יצירת מזהה של סוג מידע לתווית מותאמת אישית של מטא נתונים.
  2. כוללים את המטא-נתונים שרוצים לסרוק בשדה ContentMetadata של ContentMetadata.ContentItem

דוגמה לבקשה לסריקת מטא-נתונים שהלקוח סיפק

בדוגמה הבאה מוצגת בקשת InspectContent שכוללת גם קובץ PDF וגם מטא-נתונים שסופקו על ידי הלקוח. הבקשה משתמשת ב-infoType בהתאמה אישית בשם CUSTOM_MIP_CONFIDENTIAL_INTERNAL_USE כדי לסרוק את הקובץ ואת המטא-נתונים שסופקו לקבצים שמסומנים כ'סודיים' או 'לשימוש פנימי'.

{
  "inspect_config": {
    "custom_info_types": [
      {
        "info_type": {
          "name": "CUSTOM_MIP_CONFIDENTIAL_INTERNAL_USE"
        },
        "likelihood": "VERY_LIKELY",
        "metadata_key_value_expression": {
          "key_regex": "MSIP_Label_.*_Name",
          "value_regex": "Confidential|Internal Use"
        }
      }
    ]
  },
  "item": {
    "byte_item": {
      "type": "PDF",
      "data": "BASE64_ENCODED_PDF"
    },
    "content_metadata": {
      "properties": [
        {
          "key": "MSIP_Label_174b6716-c2ea-4041-b631-5633733fbe46_Name",
          "value": "Confidential"
        }
      ]
    }
  }
}

מחליפים את BASE64_ENCODED_PDF בקובץ בקידוד Base64 לסריקה.

אם Sensitive Data Protection מוצא התאמה במטא-נתונים שסופקו על ידי הלקוח, MetadataType של הממצא עבור MetadataLocation הוא CLIENT_PROVIDED_METADATA. אם ההתאמה היא במטא-נתונים שחולצו מהקובץ, כמו תווית MSIP, הערך הוא CONTENT_METADATA.

הערך של MetadataType עבור MetadataLocation מאוכלס בהתאם לסוג ההתאמה: התאמה שחולצה מקובץ או התאמה שסופקה על ידי הלקוח במטא-נתונים.

המאמרים הבאים