מזהה Infotype בהתאמה אישית של ביטוי רגולרי (regex) מאפשר לכם ליצור מזהים משלכם, שמאפשרים ל-Sensitive Data Protection לזהות התאמות על סמך דפוס של ביטוי רגולרי. לדוגמה, נניח שהיו לכם מספרי תיקים רפואיים בפורמט ###-#-#####. אפשר להגדיר תבנית regex כמו זו:
[0-9]{3}-[0-9]{1}-[0-9]{5}
במקרה כזה, Sensitive Data Protection יתאים פריטים כמו אלה:
012-4-56789
המבנה של גלאי מותאם אישית של סוג מידע שמבוסס על ביטוי רגולרי
כפי שמתואר בסיכום API Overview, כדי ליצור גלאי מותאם אישית של סוג מידע באמצעות ביטוי רגולרי, צריך להגדיר אובייקט CustomInfoType שמכיל את הפרטים הבאים:
- השם שרוצים לתת לגלאי סוגי המידע המותאמים אישית, בתוך אובייקט
InfoType. - ערך אופציונלי של
Likelihood. אם לא משמיטים את השדה הזה, התאמות לביטוי רגולרי יחזירו סבירות ברירת מחדל שלVERY_LIKELY. אם אתם מבחינים בכך שגלאי מותאם אישית של סוג מידע (infoType) שמבוסס על ביטוי רגולרי מחזיר יותר מדי תוצאות חיוביות שגויות, נסו להקטין את הסבירות הבסיסית ולהשתמש בכללי זיהוי כדי להגדיל את הסבירות באמצעות מידע הקשרי. מידע נוסף זמין במאמר בנושא התאמה אישית של הסבירות למציאת מידע. - אופציונלי
DetectionRules, או כללים של מילת הפעלה. הכללים האלה משנים את הסבירות לממצאים בקרבה מסוימת למילות מפתח ספציפיות. מידע נוסף על כללים של מילות הפעלה זמין במאמר התאמה אישית של הסבירות למציאת תוצאות. ערך אופציונלי של
SensitivityScore. אם לא משמיטים את השדה הזה, התאמות לביטוי הרגולרי יחזירו רמת רגישות שמוגדרת כברירת מחדל שלHIGH.ציוני הרגישות משמשים בפרופילים של נתונים. כשמבצעים פרופיל לנתונים, Sensitive Data Protection משתמש בציוני הרגישות של ה-infoTypes כדי לחשב את רמת הרגישות.
אובייקט
Regexשמורכב מדפוס יחיד שמגדיר את הביטוי הרגולרי.
אובייקט JSON של גלאי מותאם אישית של סוג מידע מסוג regex שכולל את כל הרכיבים האופציונליים נראה כך:
{
"customInfoTypes":[
{
"infoType":{
"name":"CUSTOM_INFOTYPE_NAME"
},
"likelihood":"LIKELIHOOD_LEVEL",
"detectionRules":[
{
"hotwordRule":{
HOTWORD_RULE
}
},
"sensitivityScore":{
"score": "SENSITIVITY_SCORE"
},
],
"regex":{
"pattern":"REGULAR_EXPRESSION_PATTERN"
}
}
],
...
}
דוגמה לביטוי רגולרי: התאמה של מספרי תיקים רפואיים
קטע ה-JSON הבא והקוד בכמה שפות שלמטה מציגים גלאי מותאם אישית של סוג מידע באמצעות ביטוי רגולרי, שמורה ל-Sensitive Data Protection להתאים מספר תיק רפואי (MRN) בטקסט הקלט 'Patient's MRN 444-5-22222', ולהקצות לכל התאמה סבירות של POSSIBLE.
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
למידע נוסף על שימוש ב-DLP API עם JSON, אפשר לעיין במדריך לתחילת העבודה עם JSON.
קלט JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"Patients MRN 444-5-22222"
},
"inspectConfig":{
"customInfoTypes":[
{
"infoType":{
"name":"C_MRN"
},
"regex":{
"pattern":"[1-9]{3}-[1-9]{1}-[1-9]{5}"
},
"likelihood":"POSSIBLE"
}
]
}
}
פלט JSON:
{
"result":{
"findings":[
{
"infoType":{
"name":"C_MRN"
},
"likelihood":"POSSIBLE",
"location":{
"byteRange":{
"start":"13",
"end":"24"
},
"codepointRange":{
"start":"13",
"end":"24"
}
},
"createTime":"2018-11-30T01:29:37.799Z"
}
]
}
}
בפלט אפשר לראות ש-Sensitive Data Protection זיהה נכון את מספר התיק הרפואי והקצה לו רמת ודאות של POSSIBLE, כמו שצוין, באמצעות גלאי ה-infoType המותאם אישית שנתנו לו את השם C_MRN והביטוי הרגולרי המותאם אישית שלו.
התאמה אישית של סבירות ההתאמה מבוססת על הדוגמה הזו וכוללת מילים שנותנות הקשר.