ניתוח סיכוני זיהוי מחדש, או פשוט ניתוח סיכונים, הוא תהליך של ניתוח נתונים רגישים כדי למצוא מאפיינים שעשויים להגביר את הסיכון לזיהוי של נושאים. אפשר להשתמש בשיטות לניתוח סיכונים לפני הסרת הפרטים המזהים כדי לקבוע אסטרטגיה יעילה להסרת פרטים מזהים, או אחרי הסרת הפרטים המזהים כדי לעקוב אחרי שינויים או חריגות.
Sensitive Data Protection יכול לחשב ארבעה מדדים של סיכון לזיהוי מחדש: k-anonymity, l-diversity, k-map ו-δ-presence. אם אתם לא מכירים את המושגים האלה או את ניתוח הסיכונים, כדאי לעיין בנושא ניתוח סיכונים לפני שתמשיכו.
בקטע הזה אנחנו מסבירים איך להשתמש בהגנה על מידע אישי רגיש כדי לבצע ניתוח סיכונים של נתונים מובְנים באמצעות כל אחד מהמדדים האלה, וגם נושאים קשורים אחרים.
חישוב הסיכון לשחזור פרטי זיהוי
השירות Sensitive Data Protection יכול לנתח את הנתונים המובְנים שמאוחסנים בטבלאות BigQuery ולחשב את מדדי הסיכון הבאים לזיהוי מחדש. כדי לקבל מידע נוסף, לוחצים על הקישור למדד שרוצים לחשב.
| מדד | תיאור |
|---|---|
| k-anonymity | מאפיין של מערך נתונים שמציין את האפשרות לזיהוי מחדש של הרשומות שלו. מערך נתונים הוא k-אנונימי אם המזהים למחצה של כל אדם במערך הנתונים זהים לפחות ל-k – 1 אנשים אחרים שנכללים גם הם במערך הנתונים. |
| l-diversity | הרחבה של k-אנונימיות שגם מודדת את המגוון של ערכים רגישים בכל עמודה שבה הם מופיעים. מערך נתונים הוא בעל מגוון של l אם, לכל קבוצת שורות עם מזהים פסאודונימיים זהים, יש לפחות l ערכים שונים לכל מאפיין רגיש. |
| k-map | הפונקציה מחשבת את הסיכון לזיהוי מחדש על ידי השוואה בין מערך נתונים מסוים של נושאים שעברו הסרת פרטים מזהים לבין מערך נתונים גדול יותר של זיהוי מחדש – או 'מתקפה'. |
| δ-presence | הערכת ההסתברות שמשתמש מסוים באוכלוסייה גדולה יותר מופיע במערך הנתונים. האפשרות הזו שימושית כשחברות במערך הנתונים היא מידע רגיש. |
חישוב נתונים סטטיסטיים אחרים
בנוסף, אפשר להשתמש ב-Sensitive Data Protection כדי לחשב נתונים סטטיסטיים מספריים וקטגוריים של נתונים שמאוחסנים בטבלאות BigQuery, באמצעות אותו משאב DlpJob כמו בממשקי ה-API לניתוח סיכונים.
| מדד | תיאור |
|---|---|
| נתונים סטטיסטיים מספריים | הפונקציה קובעת את הערכים המינימליים, המקסימליים והקוונטיליים של עמודה ספציפית ב-BigQuery. |
| נתונים סטטיסטיים מספריים של קטגוריות | מחשבת נתונים סטטיסטיים מספריים קטגוריים עבור משבצות ההיסטוגרמה הנפרדות בעמודה ב-BigQuery. |
מידע נוסף זמין במאמר בנושא חישוב נתונים סטטיסטיים מספריים וקטגוריים.
הדמיה של הסיכון לשחזור פרטי זיהוי
אתם יכולים לראות את מדדי הסיכון שמחושבים על ידי Sensitive Data Protection ישירות במסוף Google Cloud באמצעות Sensitive Data Protection (k-אנונימיות או l-מגוון), או באמצעות מוצרים אחרים שלGoogle Cloud .
| מוצר | תיאור |
|---|---|
| Data Studio | אחרי שמחשבים ערכים של k-אנונימיות למערך נתונים באמצעות Sensitive Data Protection, אפשר להציג את התוצאות באופן ויזואלי ב-Data Studio. כך תוכלו גם להבין טוב יותר את הסיכון לזיהוי מחדש ולעזור בהערכת הפשרות שאתם עשויים לעשות לגבי התועלת אם תצנזרו או תסירו את הפרטים המזהים מהנתונים. |