השמטת נתונים סודיים

במדריך הזה מוסבר איך להשתמש בתוסף של Cloud Data Fusion ל-Cloud DLP כדי לצנזר מידע אישי רגיש.

תרחיש

לצורך המחשה, נבחן את התרחיש הבא, שבו צריך לצנזר נתוני לקוח רגישים:

צוות התמיכה מתעד את הפרטים של כל בקשת תמיכה שהוא מטפל בה בכרטיס תמיכה. כל המידע בכרטיס התמיכה נשלף לקובץ CSV. טכנאי התמיכה לא אמורים לתעד מידע על לקוחות שנחשב לרגיש, אבל לפעמים הם עושים זאת בטעות. אתם מבחינים שבקובץ ה-CSV מופיעים מספרי הטלפון של חלק מהלקוחות.

אתם רוצים לעבור על קובץ ה-CSV ולהסתיר את כל מספרי הטלפון. אתם יוצרים צינור Cloud Data Fusion שמצנזר את נתוני הלקוחות הרגישים באמצעות הפלאגין Cloud DLP.

במדריך הזה תיצרו צינור ש:

  • מספרי הטלפון של הלקוחות מושחרים באמצעות התו #.
  • מאחסן את המידע האישי הרגיש המוסווה ואת המידע הלא רגיש בקטגוריה של Cloud Storage.

מטרות

  • מקשרים את Cloud Data Fusion למקור ב-Cloud Storage.
  • פורסים את הפלאגין Cloud DLP.
  • יוצרים תבנית Cloud DLP בהתאמה אישית.
  • משתמשים בתוסף Redact transform כדי להסתיר נתונים רגישים של לקוחות.
  • כתיבת נתוני הפלט ל-Cloud Storage.

עלויות

במסמך הזה משתמשים ברכיבים הבאים של Google Cloud, והשימוש בהם כרוך בתשלום:

כדי להעריך את ההוצאות בהתאם לתחזית השימוש שלכם, אתם יכולים להיעזר במחשבון העלויות.

משתמשים חדשים של Google Cloud ? יכול להיות שאתם זכאים לתקופת ניסיון בחינם.

לפני שמתחילים

  1. נכנסים לחשבון Google Cloud . אם אתם משתמשים חדשים ב- Google Cloud, צרו חשבון כדי שתוכלו להעריך את הביצועים של המוצרים שלנו בתרחישים מהעולם האמיתי. לקוחות חדשים מקבלים בחינם גם קרדיט בשווי 300$ להרצה, לבדיקה ולפריסה של עומסי העבודה.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  5. Verify that billing is enabled for your Google Cloud project.

  6. מפעילים את ממשקי ה-API של Cloud Data Fusion,‏ BigQuery,‏ Cloud Storage ו-Dataproc.

    תפקידים שנדרשים להפעלת ממשקי API

    כדי להפעיל ממשקי API, צריך את תפקיד ה-IAM 'אדמין של Service Usage' (roles/serviceusage.serviceUsageAdmin), שכולל את ההרשאה serviceusage.services.enable. איך מקצים תפקידים

    הפעלת ממשקי ה-API

  7. יצירת מכונת Cloud Data Fusion

קבלת הרשאות ל-Cloud DLP

  1. נכנסים לדף IAM במסוף Google Cloud .

    פתיחת הדף IAM

  2. בטבלת ההרשאות, בעמודה Principal, מחפשים את חשבון השירות שתואם לפורמט service-project-number@gcp-sa-datafusion.iam.gserviceaccount.com.

  3. לוחצים על עריכה.

  4. לוחצים על הוספת תפקיד נוסף.

  5. משתמשים בסרגל החיפוש כדי לחפש ואז בוחרים באפשרות DLP Administrator (אדמין של DLP).

  6. לוחצים על Save.

  7. בודקים שהאפשרות אדמין של DLP מופיעה בעמודה תפקיד.

כשמשתמשים ב-Cloud Data Fusion, משתמשים גם ב Google Cloud מסוף וגם בממשק המשתמש הנפרד של Cloud Data Fusion. במסוף Google Cloud , אתם יכולים ליצור פרויקט במסוף Google Cloud וליצור ולמחוק מכונות Cloud Data Fusion. בממשק המשתמש של Cloud Data Fusion, אפשר להשתמש בתכונות של Cloud Data Fusion באמצעות הדפים השונים, כמו Studio או Wrangler.

  1. נכנסים לדף Instances במסוף Google Cloud .

    פותחים את הדף Instances

  2. בעמודה פעולות של המופע, לוחצים על הקישור הצגת המופע. ממשק המשתמש של Cloud Data Fusion נפתח בכרטיסייה חדשה בדפדפן.

יצירת צינור עיבוד הנתונים

ליצור צינור שמוחק נתונים רגישים של לקוחות. הצינור שאתם יוצרים מבצע את הפעולות הבאות:

  • קורא את נתוני הקלט באמצעות פלאגין המקור של Cloud Storage.
  • פריסת הפלאגין Cloud DLP מ-Hub.
  • כותב את נתוני הפלט באמצעות תוסף של יעד ב-Cloud Storage.

טעינת נתוני הלקוחות

במדריך הזה נעשה שימוש במערך נתוני הקלט, CallCenterRecords.csv, שזמין בקטגוריה של Cloud Storage שנגישה לכולם.

  1. פותחים את מכונת Cloud Data Fusion ולוחצים על תפריט > Studio.

  2. בתפריט מקור, לוחצים על הפלאגין Cloud Storage.

    בוחרים את הפלאגין.

  3. בצומת Cloud Storage, לוחצים על Properties (מאפיינים).

  4. מזינים שם בשדה Reference name.

  5. בשדה נתיב, מזינים gs://datafusion-sample-datasets/CallCenterRecords.csv.

  6. בשדה Format, בוחרים באפשרות CSV.

  7. בסכימת הפלט, מוחקים את השדות offset ו-body. לוחצים על הוספה ומזינים את השדות הבאים:

    • תאריך
    • בנק
    • מדינה
    • מיקוד
    • הערות

    מזינים את נכסי המקור.

  8. לוחצים על אימות כדי לבדוק אם יש שגיאות.

  9. לוחצים על סגירה.

צנזור מידע אישי רגיש

התוסף Cloud DLP Redact מזהה רשומות רגישות בזרם הקלט של הנתונים ומחיל על הרשומות האלה טרנספורמציות שאתם מגדירים. רשומה של נתונים נחשבת רגישה אם היא תואמת למסננים מוגדרים מראש של Cloud DLP שאתם בוחרים או לתבנית מותאמת אישית שאתם מגדירים.

במדריך הזה, אתם רוצים לצנזר מספרי טלפון של לקוחות שחלק מטכנאי התמיכה בצוות שלכם רשמו בטעות. הם הזינו את המידע הרגיש בקטע הערות של כרטיסי התמיכה, שמופיע כעמודה הערות בקובץ ה-CSV. יוצרים תבנית מותאמת אישית של Cloud DLP, ואז מזינים את מזהה התבנית בתפריט המאפיינים של הפלאגין.

פריסת הפלאגין של Cloud DLP

  1. במכונת Cloud Data Fusion, לוחצים על Hub.

  2. לוחצים על התוסף Cloud DLP.

  3. לוחצים על פריסה.

  4. לוחצים על סיום.

  5. לוחצים על סגירה כדי לצאת מתיבת הדו-שיח של Cloud DLP.

  6. לוחצים על סגירה כדי לצאת מהמרכז.

יצירת תבנית בהתאמה אישית

  1. נכנסים לדף Cloud DLP במסוף Google Cloud .

    כניסה ל-Cloud DLP

  2. בתפריט יצירה, בוחרים באפשרות תבנית. תמונה

  3. בשדה Template ID (מזהה התבנית), מזינים מזהה לתבנית.

  4. לוחצים על Continue.

  5. בשדה הגדרת זיהוי, לוחצים על ניהול סוגי מידע.

  6. בכרטיסייה Built-in, משתמשים במסנן כדי לחפש 'מספר טלפון'.

    סינון.

  7. בוחרים באפשרות PHONE_NUMBER.

  8. לוחצים על סיום > יצירה.

מידע נוסף על יצירת תבניות של Cloud DLP

החלת טרנספורמציית הצנזורה של Cloud DLP

  1. עוברים לדף Studio ב-Cloud Data Fusion ולוחצים כדי להרחיב את התפריט Transform.

  2. לוחצים על הפלאגין Cloud DLP Redact (הסתרת מידע).

    לוחצים על הפלאגין כדי להוסיף אותו לצינור.

  3. גוררים חץ חיבור מהצומת Cloud Storage לצומת Redact.

    מחברים את שני הצמתים.

  4. מעבירים את הסמן מעל הצומת Redact (צנזורה) ולוחצים על Properties (מאפיינים).

    1. מגדירים את תבנית בהתאמה אישית לערך Yes.

    2. בשדה Template ID (מזהה התבנית), מזינים את מזהה התבנית של התבנית המותאמת אישית שיצרתם.

    3. בשדה התאמה , מחילים הסתרת מידע על תבנית בהתאמה אישית בתוך הערות.

    4. בשדה Masking Character (תו לטשטוש), מזינים #.

      מסכה.

    5. לוחצים על אימות כדי לבדוק אם יש שגיאות.

    6. לוחצים על סגירה.

אחסון נתוני הפלט

אחסון התוצאות של צינור העברת הנתונים בקובץ Cloud Storage.

  1. בדף Studio, לוחצים כדי להרחיב את התפריט Sink (יעד).

  2. לוחצים על Cloud Storage.

  3. גוררים חץ חיבור מהצומת Redact לצומת Cloud Storage2.

    מחברים את הצומת Redact (עריכה) לצומת השני של Cloud Storage.

  4. מעבירים את מצביע העכבר מעל הצומת Cloud Storage2 ולוחצים על Properties (מאפיינים).

    1. מזינים שם בשדה Reference name.

    2. בשדה Path (נתיב), מזינים את הנתיב של קטגוריה ב-Cloud Storage שבה רוצים לאחסן את תוצאות הצינור. ‫Cloud Data Fusion יוצר את הקטגוריה בשבילכם. חשוב לפעול לפי ההנחיות למתן שמות לקטגוריות.

    3. בשדה Format (פורמט), בוחרים באפשרות CSV.

    4. לוחצים על אימות כדי לוודא שאין שגיאות.

    5. לוחצים על סגירה.

הפעלת צינור הנתונים במצב תצוגה מקדימה

מריצים את צינור הנתונים במצב תצוגה מקדימה לפני הפריסה.

  1. לוחצים על תצוגה מקדימה ואז על הפעלה.

    מריצים את הפייפליין.

    כשלוחצים על Run (הפעלה), מוצג סטטוס צינור הנתונים, שמתחיל ב-Starting (התחלה), ואז משתנה ל-Stop (עצירה) ואז ל-Run (הפעלה).

  2. כשהרצת התצוגה המקדימה מסתיימת, בצומת Redact לוחצים על Preview Data כדי לראות השוואה בטבלה של נתוני הקלט והפלט זה לצד זה. בודקים שמספרי הטלפון מוסווים באמצעות התו #.

    בודקים שמספרי הטלפון מוסתרים.

השמטת סוג נתונים אחר

במהלך הבדיקה של תוצאות ההרצה בתצוגה המקדימה, שמתם לב שעדיין יש מידע רגיש שמופיע בעמודה הערות: כתובות אימייל. אתם חוזרים ועורכים את התבנית של Cloud DLP כדי לצנזר גם כתובות אימייל.

  1. נכנסים לדף Cloud DLP במסוף Google Cloud .

    פתיחת הדף Cloud DLP

  2. בכרטיסייה Configuration, בוחרים את התבנית.

  3. לוחצים על Edit.

  4. לוחצים על ניהול סוגי מידע.

  5. בכרטיסייה Built-in, משתמשים במסנן כדי לחפש את האפשרויות OR או email address.

    סינון.

  6. בוחרים באפשרות 'הכול' ולוחצים על סיום.

  7. לוחצים על Save.

  8. מריצים שוב את תהליך המכירות במצב תצוגה מקדימה. ‫Cloud Data Fusion ישתמש אוטומטית בתבנית המעודכנת של Cloud DLP.

  9. בודקים ששני מספרי הטלפון וגם כתובות האימייל מוסווים באמצעות התו #.

    בודקים שהנתונים מוסווים.

פריסה והפעלה של צינור עיבוד הנתונים

  1. מוודאים שמצב תצוגה מקדימה לא מסומן.

  2. לוחצים על Save. כשלוחצים על שמירה, מוצגת בקשה לתת שם לצינור. ואז לוחצים על אישור.

  3. לוחצים על פריסה.

  4. בסיום הפריסה, לוחצים על הפעלה. הפעלת צינור הנתונים יכולה להימשך כמה דקות. בזמן ההמתנה, תוכלו לעקוב אחרי הסטטוס של המעבר של צינור הנתונים מהקצאת משאבים להפעלה להרצה לביטול הקצאת משאבים להצלחה.

צפייה בתוצאות

  1. במסוף Google Cloud , עוברים לדף Cloud Storage.

    כניסה ל-Cloud Storage

  2. בדפדפן האחסון, עוברים לקטגוריית Cloud Storage של יעד הנתונים שצוינה במאפיינים של התוסף Cloud Storage של יעד הנתונים.

  3. בקטע כתובת URL של הקישור, לוחצים על הקישור כדי להוריד את קובץ ה-CSV עם התוצאות. בודקים שמספרי הטלפון וכתובות האימייל מוסווים באמצעות התו #.

    בודקים שהנתונים מוסווים.

הסרת המשאבים

כדי להימנע מחיובים בחשבון Google Cloud בגלל השימוש במשאבים שנעשה במסגרת המדריך הזה, אפשר למחוק את הפרויקט שמכיל את המשאבים, או להשאיר את הפרויקט ולמחוק את המשאבים בנפרד.

מחיקת מכונת Cloud Data Fusion

פועלים לפי ההוראות כדי למחוק את מכונת Cloud Data Fusion.

מחיקת הפרויקט

הדרך הקלה ביותר לבטל את החיוב היא למחוק את הפרויקט שיצרתם בשביל המדריך הזה.

כדי למחוק את הפרויקט:

  1. במסוף Google Cloud , נכנסים לדף Manage resources.

    כניסה לדף Manage resources

  2. ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על Delete.
  3. כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.

המאמרים הבאים