שימוש ב-Sensitive Data Protection לסריקת נתונים ב-BigQuery

הידיעה איפה נמצאים הנתונים הרגישים היא לרוב השלב הראשון בהבטחה שהם מאובטחים ומנוהלים בצורה נכונה. הידע הזה יכול לעזור להפחית את הסיכון לחשיפה של פרטים רגישים כמו מספרי כרטיסי אשראי, מידע רפואי, מספרי תעודות זהות, מספרי רישיונות נהיגה, כתובות, שמות מלאים וסודות ספציפיים לחברה. סריקה תקופתית של הנתונים יכולה גם לעזור לעמוד בדרישות התאימות ולהבטיח שאתם פועלים לפי השיטות המומלצות ככל שהנתונים גדלים ומשתנים עם השימוש. כדי לעמוד בדרישות התאימות, אפשר להשתמש ב-Sensitive Data Protection כדי לבדוק את הטבלאות ב-BigQuery ולהגן על הנתונים הרגישים.

יש שתי דרכים לסרוק את הנתונים ב-BigQuery:

  • יצירת פרופיל של מידע אישי רגיש. באמצעות Sensitive Data Protection אפשר ליצור פרופילים לגבי נתונים ב-BigQuery בארגון, בתיקייה או בפרויקט. פרופילי נתונים מכילים מדדים ומטא-נתונים לגבי הטבלאות שלכם, ועוזרים לכם לקבוע איפה נמצאים נתונים רגישים ונתונים בסיכון גבוה. הכלי Sensitive Data Protection מדווח על המדדים האלה ברמת הפרויקט, הטבלה והעמודה. למידע נוסף, אפשר לקרוא את המאמר פרופילי נתונים לנתוני BigQuery.

  • בדיקה על פי דרישה. באמצעות Sensitive Data Protection אפשר לבצע בדיקה מעמיקה בטבלה אחת או בקבוצת משנה של עמודות, ולדווח על הממצאים ברמת התא. בדיקה כזו יכולה לעזור לכם לזהות מקרים ספציפיים של סוגי נתונים מסוימים, כמו המיקום המדויק של מספר כרטיס אשראי בתוך תא בטבלה. אפשר לבצע בדיקה לפי דרישה דרך הדף Sensitive Data Protection במסוףGoogle Cloud , הדף BigQuery במסוף Google Cloud או באופן פרוגרמטי באמצעות DLP API.

בדף הזה מוסבר איך לבצע בדיקה לפי דרישה דרך הדף BigQuery במסוף Google Cloud .

‫Sensitive Data Protection הוא שירות מנוהל מלא שמאפשר ללקוחות לזהות מידע אישי רגיש ולהגן עליו בהיקף נרחב. Google Cloud השירות Sensitive Data Protection משתמש ביותר מ-150 גלאים שהוגדרו מראש כדי לזהות דפוסים, פורמטים וסכומי ביקורת. בנוסף, Sensitive Data Protection מספקת קבוצה של כלים להסרת פרטי זיהוי של הנתונים, כולל התממת מידע, שימוש באסימונים, פסאודונימיזציה, הזזת תאריכים ועוד, והכול בלי לשכפל את נתוני הלקוחות.

מידע נוסף על Sensitive Data Protection זמין במסמכי התיעוד בנושא Sensitive Data Protection.

לפני שמתחילים

  1. כדאי לעיין בתמחור של Sensitive Data Protection ובדרכים לשליטה בעלויות של Sensitive Data Protection.
  2. מפעילים את DLP API.

    להפעלת ה-API

  3. חשוב לוודא שלמשתמש שיוצר את העבודות של Sensitive Data Protection יש תפקיד IAM מוגדר מראש של Sensitive Data Protection או הרשאות מספיקות להרצת עבודות של Sensitive Data Protection.

סריקת נתונים ב-BigQuery באמצעות Google Cloud המסוף

כדי לסרוק נתונים ב-BigQuery, יוצרים משימה של Sensitive Data Protection שמנתחת טבלה. אפשר לסרוק טבלה ב-BigQuery במהירות באמצעות האפשרות סריקה באמצעות Sensitive Data Protection במסוף BigQuery Google Cloud .

כדי לסרוק טבלה ב-BigQuery באמצעות Sensitive Data Protection:

  1. נכנסים לדף BigQuery במסוף Google Cloud .

    כניסה ל-BigQuery

  2. בחלונית הימנית, לוחצים על כלי הניתוחים:

    כפתור מודגש לחלונית הסייר.

    אם החלונית הימנית לא מוצגת, לוחצים על הרחבת החלונית הימנית כדי לפתוח אותה.

  3. בחלונית Explorer, מרחיבים את הפרויקט, לוחצים על Datasets (מערכי נתונים) ואז לוחצים על מערך הנתונים.

  4. לוחצים על סקירה כללית > טבלאות ובוחרים את הטבלה הרצויה.

  5. לוחצים על פתיחה > סריקה באמצעות Sensitive Data Protection. הדף ליצירת משימות Sensitive Data Protection נפתח בכרטיסייה חדשה.

  6. בשלב 1: בחירת נתוני קלט, מזינים מזהה של משימה. הערכים בקטע מיקום נוצרים באופן אוטומטי. בנוסף, הקטע דגימה מוגדר אוטומטית להפעלת סריקת דגימה של הנתונים, אבל אפשר לשנות את ההגדרות לפי הצורך.

  7. לוחצים על Continue.

  8. אופציונלי: בשלב 2: הגדרת הזיהוי, אפשר להגדיר את סוגי הנתונים שרוצים לחפש, שנקראים infoTypes.

    מבצעים אחת מהפעולות הבאות:

    • כדי לבחור מתוך רשימת infoTypes מוגדרים מראש, לוחצים על ניהול סוגי מידע. לאחר מכן, בוחרים את סוגי המידע שרוצים לחפש.
    • כדי להשתמש בתבנית בדיקה קיימת, בשדה שם התבנית מזינים את שם המשאב המלא של התבנית.

    מידע נוסף על infoTypes זמין במאמר InfoTypes וגלאי infoType במסמכי התיעוד של Sensitive Data Protection.

  9. לוחצים על Continue.

  10. אופציונלי: בשלב 3: הוספת פעולות, מפעילים את האפשרות שמירה ב-BigQuery כדי לפרסם את הממצאים של Sensitive Data Protection בטבלה ב-BigQuery. אם לא שומרים את הממצאים, העבודה שהושלמה מכילה רק נתונים סטטיסטיים על מספר הממצאים ועל infoTypes שלהם. כששומרים את הממצאים ב-BigQuery, נשמרים פרטים על המיקום המדויק ורמת הביטחון של כל ממצא.

  11. אופציונלי: אם הפעלתם את האפשרות שמירה ב-BigQuery, בקטע שמירה ב-BigQuery, מזינים את הפרטים הבאים:

    • מזהה הפרויקט: מזהה הפרויקט שבו מאוחסנות התוצאות.
    • מזהה מערך הנתונים: השם של מערך הנתונים שבו מאוחסנות התוצאות.
    • אופציונלי: מזהה הטבלה: השם של הטבלה שבה מאוחסנים התוצאות. אם לא מציינים מזהה טבלה, מוקצה לטבלה חדשה שם ברירת מחדל שדומה לשם הבא: dlp_googleapis_date_1234567890. אם מציינים טבלה קיימת, הממצאים יצורפו אליה.

    כדי לכלול את התוכן עצמו שזוהה, מפעילים את האפשרות ציטוט.

  12. לוחצים על Continue.

  13. אופציונלי: בשלב 4: תזמון, מגדירים טווח זמן או תזמון על ידי בחירה באפשרות ציון טווח זמן או באפשרות יצירת טריגר להפעלת העבודה בתזמון מחזורי.

  14. לוחצים על Continue.

  15. אופציונלי: בדף בדיקה, בודקים את פרטי המשרה. אם צריך, משנים את ההגדרות הקודמות.

  16. לוחצים על יצירה.

  17. אחרי שהעבודה של Sensitive Data Protection מסתיימת, מועברים לדף הפרטים של העבודה ומקבלים על כך הודעה באימייל. אפשר לראות את תוצאות הסריקה בדף פרטי העבודה, או ללחוץ על הקישור לדף פרטי העבודה של Sensitive Data Protection באימייל שמתקבל עם סיום העבודה.

  18. אם בחרתם לפרסם את הממצאים של Sensitive Data Protection ב-BigQuery, בדף פרטי המשימה לוחצים על הצגת הממצאים ב-BigQuery כדי לפתוח את הטבלה במסוף Google Cloud . לאחר מכן תוכלו להריץ שאילתות על הטבלה ולנתח את הממצאים. מידע נוסף על שאילתות של תוצאות ב-BigQuery זמין במאמר שאילתות של ממצאים של Sensitive Data Protection ב-BigQuery במסמכי התיעוד של Sensitive Data Protection.

המאמרים הבאים

אם רוצים לצנזר או להסיר את הפרטים המזהים מהמידע האישי הרגיש שנמצא בסריקה של Sensitive Data Protection, אפשר לעיין במאמרים הבאים: