השירות Sensitive Data Protection עוזר לכם להבין, לנהל ולהגן על מידע אישי רגיש. באמצעות Sensitive Data Protection, אתם יכולים לסווג ולצנזר בקלות מידע רגיש שמופיע בתוכן מבוסס-טקסט ובתמונות, כולל תוכן שמאוחסן במאגרי אחסון שלGoogle Cloud .
סיווג הטקסט
בהינתן קלט הטקסט הבא:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
הפלט הוא רשימה של ממצאים, שמסודרים לפי הקטגוריות הבאות:
InfoTypeLikelihood-
Offset(המיקום במחרוזת שבו נמצאהInfoTypeפוטנציאלית)
בטבלה הבאה מוצגת דוגמה לפלט.
InfoType |
Likelihood |
Offset |
|---|---|---|
US_HEALTHCARE_NPI |
VERY_LIKELY |
122 |
EMAIL_ADDRESS |
LIKELY |
72 |
US_DRIVERS_LICENSE_NUMBER |
LIKELY |
155 |
CANADA_BC_PHN |
VERY_UNLIKELY |
122 |
UK_TAXPAYER_REFERENCE |
VERY_UNLIKELY |
122 |
CANADA_PASSPORT |
VERY_UNLIKELY |
155 |
הסתרת טקסט אוטומטית
הצנזורה האוטומטית יוצרת פלט שבו הוסרו התאמות למידע אישי רגיש, במקום לספק רשימה של ממצאים.
דוגמה לקלט של צנזורה אוטומטית:
Please update my records with the following information: Email address: foo@example.com National Provider Identifier: 1245319599 Driver's license: AC333991
פלט לדוגמה עם placeholder של "***":
Please update my records with the following information: Email address: *** National Provider Identifier: *** Driver's license: ***
סיווג תמונות
הטכנולוגיה של זיהוי תווים אופטי (OCR) ב-Sensitive Data Protection מאפשרת לזהות טקסט לפני הסיווג. בדומה לסיווג טקסט, הוא מחזיר ממצאים, אבל הוא גם מוסיף תיבת תוחמת שבה נמצא הטקסט.
סיווג האחסון
סיווג האחסון סורק נתונים שמאוחסנים ב-Cloud Storage, ב-Firestore במצב Datastore (Datastore) וב-BigQuery. במקום להזרים נתונים ל-Sensitive Data Protection, מציינים בבקשה את מיקום האחסון של הקטגוריה ב-Cloud Storage, סוג Datastore או טבלה ב-BigQuery שרוצים ש-Sensitive Data Protection יסרוק.
כשסורקים קבצים במיקומים ב-Cloud Storage, Sensitive Data Protection תומכת בסריקה של קבצים בינאריים, קובצי טקסט, קובצי תמונה, קובצי Microsoft Word, קובצי Microsoft Excel, קובצי Microsoft Powerpoint, קובצי PDF וקובצי Apache Avro. רשימה של סיומות קבצים לסוגי הקבצים ב-Cloud Storage שאפשר לסרוק באמצעות Sensitive Data Protection זמינה בדף ההפניה ל-API של FileType.
קבצים מסוגים לא מזוהים נסרקים כקבצים בינאריים.
אפשר לשמור את תוצאות הסריקה בטבלת BigQuery חדשה או לפרסם אותן בנושא Pub/Sub. אחרי הייצוא, אפשר להשתמש בכלים המובנים של BigQuery כדי להריץ ניתוחי SQL מורכבים, או בכלים כמו Data Studio כדי ליצור דוחות.
מידע נוסף על סריקת מאגרי אחסון לחיפוש מידע אישי רגיש באמצעות Sensitive Data Protection זמין במאמר בדיקת אחסון ומסדי נתונים לחיפוש מידע אישי רגיש.
מידע נוסף על הצגת תוצאות הסריקה באמצעות כלים אחרים Google Cloudזמין במאמר ניתוח של ממצאי Sensitive Data Protection ודיווח עליהם.
המאמרים הבאים
- מידע נוסף על בדיקה ועריכה של תמונות
- מידע על שיטות טרנספורמציה שאפשר להשתמש בהן עם ההגנה על נתונים רגישים.
- עוברים על ה-codelab בנושא צנזור מידע אישי רגיש באמצעות Sensitive Data Protection.
- מידע נוסף על יצירת עותק של נתונים שעברו הסרת פרטים מזהים באחסון