ב-Sensitive Data Protection יש הרבה גלאי infoType מובנים, אבל אפשר גם ליצור גלאים משלכם. אתם יכולים להתאים אישית את אופן הזיהוי על ידי הגדרת גלאי infoType בהתאמה אישית משלכם, כך ש-Sensitive Data Protection יבדוק או יבטל את הזיהוי של מידע אישי רגיש שתואם לדפוסים שתציינו. אלה הסוגים של גלאי מידע מותאם אישית:
- מזהים רגילים של מילונים בהתאמה אישית הם רשימות פשוטות של מילים וצירופי מילים שהשירות Sensitive Data Protection מתאים להן. כדאי להשתמש בגלאים רגילים של מילון מותאם אישית אם יש לכם לכל היותר כמה מאות אלפי מילים.
- גלאים גדולים של מילונים בהתאמה אישית נוצרים על ידי Sensitive Data Protection באמצעות רשימות גדולות של מילים או ביטויים שמאוחסנים ב-Cloud Storage או ב-BigQuery. משתמשים בגלאים של מילונים גדולים בהתאמה אישית כשיש רשימה גדולה של מילים או ביטויים – עד עשרות מיליונים.
- מזהים של ביטויים רגולריים (regex) מאפשרים להשתמש בהגנה על נתונים רגישים כדי לזהות התאמות על סמך דפוס של ביטוי רגולרי.
- מזהי תוויות של מטא-נתונים מאפשרים ל-Sensitive Data Protection לזהות התאמות על סמך נוכחות של צמדי מפתח/ערך ספציפיים במטא-נתונים של התוכן.
- מזהי Infotype חלופיים מזהים פלט מטרנספורמציה של הסרת פרטים מזהים של Sensitive Data Protection
CryptoReplaceFfxFpeConfig. הגלאי המותאם אישית הזה של סוגי מידע משמש רק עם השיטהcontent:reidentifyלביטול הסרת הפרטים המזהים באמצעות הצפנה ששומרת על הפורמט (FPE) במצב FFX. לכן, לא מתואר כאן בהרחבה מהו תחליף. מידע נוסף על האופן והזמן שבהם כדאי להשתמש בגלאי מידע מותאם אישית חלופי זמין במאמר בנושא פסאודונימיזציה.
כדי לשפר את תוצאות הסריקה, אפשר ליצור כללי בדיקה.
מידע נוסף על גלאי סוגי מידע מותאמים אישית זמין בדף המושגים סוגי מידע וגלאי סוגי מידע. כאן אפשר לראות כמה דוגמאות לגלאי infoType מותאמים אישית שאפשר להשתמש בהם או לשנות אותם לפי הצורך. בהמשך המאמר הזה מוסבר איך להשתמש ב-Sensitive Data Protection כדי ליצור גלאי Infotype מותאמים אישית.
איפה אפשר להשתמש בגלאי סוגי מידע מותאמים אישית
מזהי מידע מותאמים אישית מוגדרים באובייקט CustomInfoType. כשמגדירים את ההגדרות הבאות, מציינים CustomInfoType באובייקט InspectConfig:
- בדיקה באמצעות
projects.content.inspect. - משרות בתחום הבדיקות בתוך
InspectJobConfig. - תבניות של בדיקות בתוך
InspectTemplate. - הסרת פרטי הזיהוי באמצעות
projects.content.deidentify. - תבניות להסרת פרטי הזיהוי בתוך
DeidentifyTemplate. - זיהוי מחדש של תוכן שעבר דה-אינדנטיפיקציה באמצעות FPE במצב FFX באמצעות
projects.content.reidentify. התרחיש הזה ספציפי לגלאי מידע מותאם אישית חלופי.
סקירה כללית על ממשקי API
האובייקט
CustomInfoType
מאפשר ליצור גלאי מותאם אישית של infoType לתוכן חדש או לכוונן את התוצאות שמוחזרות על ידי גלאים מוגדרים מראש של infoType.
אובייקט CustomInfoType מורכב מהשדות הבאים, שמוגדרים כמו שמתואר:
-
"infotype": השם של גלאי סוג המידע המותאם אישית, שמופיע באובייקטInfoType. -
"likelihood": ערך ברירת המחדלLikelihoodשיוחזר עבור גלאי סוג המידע המותאם אישית הזה. אתם יכולים לציין ערכים חלופיים שלLikelihoodב-"detectionRules"שיחליפו את ערך הבסיס שלLikelihoodאם הממצא עומד בקריטריונים שצוינו בכלל. אם לא כוללים את השדה"likelihood", ברירת המחדל של הכלי המותאם אישית לזיהוי סוגי מידע היאVERY_LIKELY. מידע נוסף על הסבירות מופיע בדף המושג סבירות. -
"detectionRules": קבוצה של אובייקטים מסוגDetectionRuleשיוחלו בנוסף על כל הממצאים של גלאי סוג המידע המותאם אישית הזה. כאן מציינים את כללי מילות ההפעלה, כאובייקטים שלHotwordRule. הכללים מוחלים לפי הסדר שבו הם צוינו. השדה הזה לא רלוונטי לאובייקטים מסוגSurrogateType. "sensitivityScore": הערךSensitivityScoreשיוחזר עבור גלאי סוג המידע המותאם אישית הזה. אם לא כוללים את השדה"sensitivityScore", ברירת המחדל של הכלי המותאם אישית לזיהוי סוגי מידע היאVERY_LIKELY.ציוני הרגישות משמשים בפרופילים של נתונים. כשמבצעים פרופיל לנתונים, Sensitive Data Protection משתמש בציוני הרגישות של ה-infoTypes כדי לחשב את רמת הרגישות.
אחד מהשדות הבאים, בהתאם לסוג הכלי לזיהוי סוגי מידע מותאמים אישית שאתם יוצרים:
-
"dictionary": אובייקט מסוגDictionaryשמכיל רשימה של מילים או ביטויים לחיפוש. -
"regex": אובייקט מסוגRegexשמכיל תבנית אחת שמגדירה את הביטוי הרגולרי. -
"surrogateType": אובייקטSurrogateType, אם הוא קיים, מציין שגלאי סוג המידע המותאם אישית הוא תחליף. מידע נוסף על שימוש בגלאי מידע מותאם אישית חלופי זמין במאמר פסאודונימיזציה. -
"storedType": הפניה לאובייקט קיים מסוגStoredInfoType. חובה למלא את השדה הזה כשיוצרים גלאי מילון מותאם אישית גדול. אפשר להגדיר את השדה הזה כדי ליצור גלאי מילון רגיל או גלאי ביטוי רגולרי, אבל יותר פשוט להגדיר את השדהdictionaryאו את השדהregexכדי ליצור אותם. -
"metadata_key_value_expression": אובייקטMetadataKeyValueExpressionשמגדיר ביטויים רגולריים למפתח ולערך לחיפוש במטא-נתונים של התוכן.
-
השלבים הבאים
מידע נוסף על יצירת סוגי מידע מותאמים אישית זמין בנושאים הבאים:
- יצירת מזהה מותאם אישית של מילון רגיל: כאן מוסבר איך ליצור מזהה מותאם אישית של סוג מידע כדי להתאים ממצאים לרשימה של מילים וביטויים.
- יצירת מזהה מותאם אישית של מילון גדול: איך להתאים ממצאים לרשימה גדולה מאוד של מילים וביטויים. מזהים של סוגי מידע מותאמים אישית שמאוחסנים יכולים להתאים לעשרות מיליוני מילים.
- יצירת מזהה בהתאמה אישית של ביטוי רגולרי: מידע על יצירת מזהה בהתאמה אישית של סוג מידע כדי להתאים ממצאים לביטוי רגולרי
- שינוי של גלאי סוגי מידע כדי לשפר את תוצאות הסריקה: כאן מוסבר איך ליצור משנים לגלאי סוגי מידע מובנים ומותאמים אישית, כדי לשפר את תוצאות הסריקה.
- התאמה אישית של סבירות להתאמה: איך משתמשים בכללי זיהוי ובמילות מפתח כדי להתאים אישית את ערכי הסבירות שמוקצים להתאמות של גלאים בהתאמה אישית.
- דוגמאות למזהים מותאמים אישית של infoType: כמה דוגמאות להגדרות של מזהים מותאמים אישית של infoType בפורמט JSON, שאפשר להשתמש בהן או לשנות אותן לפי הצורך.