סיווג, צנזורה והסרת פרטים מזהים

השירות Sensitive Data Protection עוזר לכם להבין, לנהל ולהגן על מידע אישי רגיש. באמצעות Sensitive Data Protection, אתם יכולים לסווג ולצנזר בקלות מידע רגיש שמופיע בתוכן מבוסס-טקסט ובתמונות, כולל תוכן שמאוחסן במאגרי אחסון שלGoogle Cloud .

סיווג הטקסט

בהינתן קלט הטקסט הבא:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

הפלט הוא רשימה של ממצאים, שמסודרים לפי הקטגוריות הבאות:

  • InfoType
  • Likelihood
  • Offset (המיקום במחרוזת שבו נמצאה InfoType פוטנציאלית)

בטבלה הבאה מוצגת דוגמה לפלט.

InfoType Likelihood Offset
US_HEALTHCARE_NPI VERY_LIKELY 122
EMAIL_ADDRESS LIKELY 72
US_DRIVERS_LICENSE_NUMBER LIKELY 155
CANADA_BC_PHN VERY_UNLIKELY 122
UK_TAXPAYER_REFERENCE VERY_UNLIKELY 122
CANADA_PASSPORT VERY_UNLIKELY 155

הסתרת טקסט אוטומטית

הצנזורה האוטומטית יוצרת פלט שבו הוסרו התאמות למידע אישי רגיש, במקום לספק רשימה של ממצאים.

דוגמה לקלט של צנזורה אוטומטית:

Please update my records with the following information:
Email address: foo@example.com

National Provider Identifier: 1245319599

Driver's license: AC333991

פלט לדוגמה עם placeholder של "***":

Please update my records with the following information:
Email address: ***

National Provider Identifier: ***

Driver's license: ***

סיווג תמונות

הטכנולוגיה של זיהוי תווים אופטי (OCR) ב-Sensitive Data Protection מאפשרת לזהות טקסט לפני הסיווג. בדומה לסיווג טקסט, הוא מחזיר ממצאים, אבל הוא גם מוסיף תיבת תוחמת שבה נמצא הטקסט.

סיווג האחסון

סיווג האחסון סורק נתונים שמאוחסנים ב-Cloud Storage, ב-Firestore במצב Datastore ‏ (Datastore) וב-BigQuery. במקום להזרים נתונים ל-Sensitive Data Protection, מציינים בבקשה את מיקום האחסון של הקטגוריה ב-Cloud Storage, סוג Datastore או טבלה ב-BigQuery שרוצים ש-Sensitive Data Protection יסרוק.

כשסורקים קבצים במיקומים ב-Cloud Storage, Sensitive Data Protection תומכת בסריקה של קבצים בינאריים, קובצי טקסט, קובצי תמונה, קובצי Microsoft Word, קובצי Microsoft Excel, קובצי Microsoft Powerpoint, קובצי PDF וקובצי Apache Avro. רשימה של סיומות קבצים לסוגי הקבצים ב-Cloud Storage שאפשר לסרוק באמצעות Sensitive Data Protection זמינה בדף ההפניה ל-API של FileType. קבצים מסוגים לא מזוהים נסרקים כקבצים בינאריים.

אפשר לשמור את תוצאות הסריקה בטבלת BigQuery חדשה או לפרסם אותן בנושא Pub/Sub. אחרי הייצוא, אפשר להשתמש בכלים המובנים של BigQuery כדי להריץ ניתוחי SQL מורכבים, או בכלים כמו Data Studio כדי ליצור דוחות.

מידע נוסף על סריקת מאגרי אחסון לחיפוש מידע אישי רגיש באמצעות Sensitive Data Protection זמין במאמר בדיקת אחסון ומסדי נתונים לחיפוש מידע אישי רגיש.

מידע נוסף על הצגת תוצאות הסריקה באמצעות כלים אחרים Google Cloudזמין במאמר ניתוח של ממצאי Sensitive Data Protection ודיווח עליהם.

המאמרים הבאים