השירות Sensitive Data Protection יכול לזהות ולסווג מידע אישי רגיש בתוכן טקסט. בהינתן קלט טקסט, DLP API מחזיר פרטים על כל infoTypes שנמצאו בטקסט, ערך הסבירות ומידע על ההיסט.
שיטות מומלצות
זיהוי ותעדוף של סריקות
חשוב לזהות את המשאבים ולציין לאילו מהם יש עדיפות גבוהה יותר לסריקה. כשמתחילים להשתמש ב-Data Classification, יכול להיות שיש לכם כמות גדולה של נתונים שצריך לסווג, ואי אפשר לסרוק את כולם בבת אחת. מומלץ לבחור בהתחלה נתונים שמציבים את הסיכון הגבוה ביותר – לדוגמה, נתונים שניגשים אליהם לעיתים קרובות, נתונים שנגישים לכולם או נתונים לא ידועים.
הפחתת זמן האחזור
הזמן האחזור מושפע מכמה גורמים: כמות הנתונים שצריך לסרוק, מאגר האחסון שנסרק וסוגי ה-infoType ומספרם שמופעלים.
כדי לצמצם את זמן האחזור של העבודות, אפשר לנסות את הפעולות הבאות:
- מפעילים דגימה.
- מומלץ להימנע מהפעלת סוגי מידע שלא נחוצים. למרות שהם שימושיים בתרחישים מסוימים, חלק מה-infoTypes – כולל
PERSON_NAME,FEMALE_NAME,MALE_NAME,FIRST_NAME,LAST_NAME,DATE_OF_BIRTH,LOCATION,STREET_ADDRESSו-ORGANIZATION_NAME– עלולים לגרום להרצת בקשות לאט יותר מאשר בקשות שלא כוללות אותם. - תמיד צריך לציין במפורש את סוגי המידע. אל תשתמשו ברשימה ריקה של infoTypes.
- כדי לצמצם את מספר ההלוך ושוב ברשת, מומלץ לארגן את הנתונים לבדיקה בטבלה עם שורות ועמודות, אם אפשר.
הגבלת היקף הסריקות הראשונות
כדי לקבל את התוצאות הטובות ביותר, כדאי להגביל את היקף הסריקות הראשונות במקום לסרוק את כל הנתונים. מתחילים עם כמה בקשות. התובנות שתקבלו יהיו משמעותיות יותר אם תגדירו במדויק אילו אמצעי זיהוי להפעיל ואילו כללי החרגה עשויים להידרש כדי לצמצם את מספר התוצאות החיוביות השגויות. כדאי להימנע מהפעלת כל סוגי המידע אם לא צריך את כולם, כי טעויות בזיהוי או ממצאים לא שמישים עלולים להקשות על הערכת הסיכון. סוגי מידע מסוימים, כמו DATE, TIME, DOMAIN_NAME ו-URL, מזהים מגוון רחב של ממצאים, ולכן לא תמיד כדאי להפעיל אותם.
סריקות מקומיות, היברידיות ומרובות עננים
אם הנתונים שרוצים לסרוק נמצאים בשרת מקומי או מחוץ ל- Google Cloud, אפשר להשתמש בשיטות ה-API content.inspect ו-content.deidentify כדי לסרוק את התוכן, לסווג את הממצאים ולבצע פסאודונימיזציה של התוכן בלי לשמור אותו מחוץ לאחסון המקומי.
בדיקת מחרוזת טקסט
בהמשך מופיעות דוגמאות ל-JSON ולקוד בכמה שפות שמדגימות איך להשתמש ב-DLP API כדי לבדוק מחרוזות טקסט לחיפוש מידע אישי רגיש.
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Ruby
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
REST
למידע נוסף על שימוש ב-DLP API עם JSON, אפשר לעיין במדריך לתחילת העבודה עם JSON.
קלט JSON:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"My phone number is (415) 555-0890"
},
"inspectConfig":{
"includeQuote":true,
"minLikelihood":"POSSIBLE",
"infoTypes":{
"name":"PHONE_NUMBER"
}
}
}
פלט JSON:
{
"result":{
"findings":[
{
"quote":"(415) 555-0890",
"infoType":{
"name":"PHONE_NUMBER"
},
"likelihood":"VERY_LIKELY",
"location":{
"byteRange":{
"start":"19",
"end":"33"
},
"codepointRange":{
"start":"19",
"end":"33"
}
},
"createTime":"2018-11-13T19:29:15.412Z"
}
]
}
}
בדיקת קובץ טקסט
בדוגמאות הקוד הבאות אפשר לראות איך בודקים אם יש תוכן רגיש בקובץ טקסט.
C#
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Go
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Ruby
מידע על התקנת ספריית הלקוח של Sensitive Data Protection והשימוש בה מופיע במאמר ספריות הלקוח של Sensitive Data Protection.
כדי לבצע אימות ב-Sensitive Data Protection, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
המאמרים הבאים
- עוברים על ה-codelab בנושא צנזור מידע אישי רגיש באמצעות Sensitive Data Protection.
- איך בודקים אם יש בתמונות מידע אישי רגיש