מזהים מותאמים אישית של סוגי מידע

ב-Sensitive Data Protection יש הרבה גלאי infoType מובנים, אבל אפשר גם ליצור גלאים משלכם. אתם יכולים להתאים אישית את אופן הזיהוי על ידי הגדרת גלאי infoType בהתאמה אישית משלכם, כך ש-Sensitive Data Protection יבדוק או יבטל את הזיהוי של מידע אישי רגיש שתואם לדפוסים שתציינו. אלה הסוגים של גלאי מידע מותאם אישית:

  • מזהים רגילים של מילונים בהתאמה אישית הם רשימות פשוטות של מילים וצירופי מילים שהשירות Sensitive Data Protection מתאים להן. כדאי להשתמש בגלאים רגילים של מילון מותאם אישית אם יש לכם לכל היותר כמה מאות אלפי מילים.
  • גלאים גדולים של מילונים בהתאמה אישית נוצרים על ידי Sensitive Data Protection באמצעות רשימות גדולות של מילים או ביטויים שמאוחסנים ב-Cloud Storage או ב-BigQuery. משתמשים בגלאים של מילונים גדולים בהתאמה אישית כשיש רשימה גדולה של מילים או ביטויים – עד עשרות מיליונים.
  • מזהים של ביטויים רגולריים (regex) מאפשרים להשתמש בהגנה על נתונים רגישים כדי לזהות התאמות על סמך דפוס של ביטוי רגולרי.
  • מזהי תוויות של מטא-נתונים מאפשרים ל-Sensitive Data Protection לזהות התאמות על סמך נוכחות של צמדי מפתח/ערך ספציפיים במטא-נתונים של התוכן.
  • מזהי Infotype חלופיים מזהים פלט מטרנספורמציה של הסרת פרטים מזהים של Sensitive Data Protection CryptoReplaceFfxFpeConfig. הגלאי המותאם אישית הזה של סוגי מידע משמש רק עם השיטה content:reidentify לביטול הסרת הפרטים המזהים באמצעות הצפנה ששומרת על הפורמט (FPE) במצב FFX. לכן, לא מתואר כאן בהרחבה מהו תחליף. מידע נוסף על האופן והזמן שבהם כדאי להשתמש בגלאי מידע מותאם אישית חלופי זמין במאמר בנושא פסאודונימיזציה.

כדי לשפר את תוצאות הסריקה, אפשר ליצור כללי בדיקה.

מידע נוסף על גלאי סוגי מידע מותאמים אישית זמין בדף המושגים סוגי מידע וגלאי סוגי מידע. כאן אפשר לראות כמה דוגמאות לגלאי infoType מותאמים אישית שאפשר להשתמש בהם או לשנות אותם לפי הצורך. בהמשך המאמר הזה מוסבר איך להשתמש ב-Sensitive Data Protection כדי ליצור גלאי Infotype מותאמים אישית.

איפה אפשר להשתמש בגלאי סוגי מידע מותאמים אישית

מזהי מידע מותאמים אישית מוגדרים באובייקט CustomInfoType. כשמגדירים את ההגדרות הבאות, מציינים CustomInfoType באובייקט InspectConfig:

סקירה כללית על ממשקי API

האובייקט CustomInfoType מאפשר ליצור גלאי מותאם אישית של infoType לתוכן חדש או לכוונן את התוצאות שמוחזרות על ידי גלאים מוגדרים מראש של infoType.

אובייקט CustomInfoType מורכב מהשדות הבאים, שמוגדרים כמו שמתואר:

  • "infotype": השם של גלאי סוג המידע המותאם אישית, שמופיע באובייקט InfoType.
  • "likelihood": ערך ברירת המחדל Likelihood שיוחזר עבור גלאי סוג המידע המותאם אישית הזה. אתם יכולים לציין ערכים חלופיים של Likelihood ב-"detectionRules" שיחליפו את ערך הבסיס של Likelihood אם הממצא עומד בקריטריונים שצוינו בכלל. אם לא כוללים את השדה "likelihood", ברירת המחדל של הכלי המותאם אישית לזיהוי סוגי מידע היא VERY_LIKELY. מידע נוסף על הסבירות מופיע בדף המושג סבירות.
  • "detectionRules": קבוצה של אובייקטים מסוג DetectionRule שיוחלו בנוסף על כל הממצאים של גלאי סוג המידע המותאם אישית הזה. כאן מציינים את כללי מילות ההפעלה, כאובייקטים של HotwordRule. הכללים מוחלים לפי הסדר שבו הם צוינו. השדה הזה לא רלוונטי לאובייקטים מסוג SurrogateType.
  • "sensitivityScore": הערך SensitivityScore שיוחזר עבור גלאי סוג המידע המותאם אישית הזה. אם לא כוללים את השדה "sensitivityScore", ברירת המחדל של הכלי המותאם אישית לזיהוי סוגי מידע היא VERY_LIKELY.

    ציוני הרגישות משמשים בפרופילים של נתונים. כשמבצעים פרופיל לנתונים, Sensitive Data Protection משתמש בציוני הרגישות של ה-infoTypes כדי לחשב את רמת הרגישות.

  • אחד מהשדות הבאים, בהתאם לסוג הכלי לזיהוי סוגי מידע מותאמים אישית שאתם יוצרים:

    • "dictionary": אובייקט מסוג Dictionary שמכיל רשימה של מילים או ביטויים לחיפוש.
    • "regex": אובייקט מסוג Regex שמכיל תבנית אחת שמגדירה את הביטוי הרגולרי.
    • "surrogateType": אובייקט SurrogateType, אם הוא קיים, מציין שגלאי סוג המידע המותאם אישית הוא תחליף. מידע נוסף על שימוש בגלאי מידע מותאם אישית חלופי זמין במאמר פסאודונימיזציה.
    • "storedType": הפניה לאובייקט קיים מסוג StoredInfoType. חובה למלא את השדה הזה כשיוצרים גלאי מילון מותאם אישית גדול. אפשר להגדיר את השדה הזה כדי ליצור גלאי מילון רגיל או גלאי ביטוי רגולרי, אבל יותר פשוט להגדיר את השדה dictionary או את השדה regex כדי ליצור אותם.
    • "metadata_key_value_expression": אובייקט MetadataKeyValueExpression שמגדיר ביטויים רגולריים למפתח ולערך לחיפוש במטא-נתונים של התוכן.

השלבים הבאים

מידע נוסף על יצירת סוגי מידע מותאמים אישית זמין בנושאים הבאים: