מחשוב סודי לניתוח נתונים, ל-AI וללמידה משותפת

Last reviewed 2024-12-20 UTC

במסמך הזה מופיעה סקירה כללית של מחשוב חסוי, כולל הסבר על האופן שבו אפשר להשתמש בו לשיתוף פעולה מאובטח בנתונים, לאימון מודלים של AI וללמידה מאוחדת. במסמך מופיע גם מידע על שירותי Confidential Computing ב-Google Cloud , וכן הפניות לארכיטקטורות שמתאימות לתרחישי שימוש שונים.

המסמך הזה מיועד למנהלים בתחום הטכנולוגיה, ומטרתו לעזור להם להבין את הפוטנציאל העסקי של מחשוב חסוי עם AI גנרטיבי ו-AI יישומי בתעשיות שונות, כולל שירותים פיננסיים ושירותי בריאות.

מה זה Confidential Computing?

בדרך כלל, שיטות לאבטחת מידע מתמקדות בהגנה על נתונים באחסון ועל נתונים בתנועה באמצעות הצפנה. Confidential Computing מוסיף שכבת הגנה חדשה על ידי טיפול בנקודת החולשה של נתונים במהלך השימוש הפעיל בהם. הטכנולוגיה הזו מבטיחה שמידע רגיש יישאר סודי גם בזמן העיבוד שלו, וכך עוזרת לסגור פער קריטי באבטחת המידע.

סביבת מחשוב חסויה מטמיעה הגנה על נתונים שנמצאים בשימוש באמצעות סביבת מחשוב אמינה (TEE) שמבוססת על חומרה. סביבת מחשוב אמינה היא אזור מאובטח במעבד שמגן על הסודיות והשלמות של הקוד והנתונים שנטענים לתוכה. סביבת מחשוב אמינה פועלת כחדר בטוח לפעולות רגישות, וכך מצמצמת את הסיכון לנתונים גם אם המערכת נפגעה. באמצעות מחשוב חסוי, אפשר לשמור על הנתונים מוצפנים בזיכרון במהלך העיבוד.

לדוגמה, אתם יכולים להשתמש ב-Confidential Computing לניתוח נתונים וללמידת מכונה כדי להשיג את המטרות הבאות:

  • פרטיות משופרת: אפשר לבצע ניתוח של מערכי נתונים רגישים (לדוגמה, רשומות רפואיות או נתונים פיננסיים) בלי לחשוף את הנתונים לתשתית הבסיסית או לצדדים שמעורבים בחישוב.
  • שיתוף פעולה מאובטח: אפשר לאמן ביחד מודלים של למידת מכונה או לבצע ניתוח של מערכי נתונים משולבים של כמה גורמים בלי לחשוף נתונים פרטיים אחד לשני. השימוש בטכנולוגיית מחשוב חסוי מעודד אמון ומאפשר לפתח מודלים חזקים וכלליים יותר, במיוחד בתחומים כמו שירותי בריאות וכספים.
  • אבטחת נתונים משופרת: צמצום הסיכון לפרצות אבטחה ולגישה לא מורשית, כדי להבטיח עמידה בתקנות להגנה על נתונים – כמו התקנה הכללית להגנה על מידע (GDPR) או חוק היבילות ואחריות הדיווח של ביטוח בריאות (HIPAA).
  • הגברת האמון והשקיפות: אפשר לספק הוכחה שניתנת לאימות לכך שהחישובים מתבצעים על הנתונים הרצויים ובסביבה מאובטחת, וכך להגביר את האמון בקרב בעלי העניין.

איך פועלת סביבת מחשוב חסוי

סביבות מחשוב חסויות כוללות את המאפיינים הבאים:

  • הצפנה בזמן ריצה: המעבד שומר על הצפנה של כל הנתונים בסביבת המחשוב הסודי בזיכרון. כל רכיב מערכת או תוקף חומרה שמנסה לקרוא נתונים בסביבת מחשוב חסוי ישירות מהזיכרון, רואה רק נתונים מוצפנים. באופן דומה, ההצפנה מונעת שינוי של נתונים בסביבת מחשוב סודי באמצעות גישה ישירה לזיכרון.
  • בידוד: המעבד חוסם גישה מבוססת-תוכנה לסביבת המחשוב הסודי. מערכת ההפעלה ואפליקציות אחרות יכולות לתקשר עם סביבת המחשוב החסוי רק דרך ממשקים ספציפיים.
  • אימות: בהקשר של Confidential Computing, אימות מוודא את מהימנות סביבת Confidential Computing. באמצעות אימות, המשתמשים יכולים לראות את ההוכחה לכך ש-Confidential Computing מגן על הנתונים שלהם, כי האימות מאפשר לאמת את מופע ה-TEE.

    במהלך תהליך האימות, שבב המעבד שתומך ב-TEE יוצר דוח חתום קריפטוגרפית (שנקרא דוח אימות) של המדידה של המופע. לאחר מכן המדידה נשלחת לשירות אימות. אימות של בידוד תהליכים מאמת אפליקציה. אימות של בידוד מכונות וירטואליות מאמת מכונה וירטואלית, את הקושחה הווירטואלית שמשמשת להפעלת המכונה הווירטואלית או את שניהם.

  • אבטחה של מחזור החיים של הנתונים: Confidential Computing יוצר סביבת עיבוד מאובטחת כדי לספק הגנה על נתונים בשימוש שמגובה בחומרה.

טכנולוגיית Confidential Computing

הטכנולוגיות הבאות מאפשרות שימוש ב-Confidential Computing:

  • אזורים מאובטחים, שנקראים גם מחשוב סודי מבוסס-אפליקציה
  • ‫Confidential VMs ו-GPUs, שנקראים גם VM-based confidential computing

‫Google Cloud משתמש ב-Confidential VM כדי להפעיל מחשוב חסוי. מידע נוסף זמין במאמר בנושא הטמעה של Confidential Computing ב-Google Cloud.

Secure enclaves

מובלעת מאובטחת היא סביבת מחשוב שמספקת בידוד לקוד ולנתונים ממערכת ההפעלה באמצעות בידוד מבוסס-חומרה, או באמצעות בידוד של מכונה וירטואלית שלמה על ידי הצבת ההיפר-ויז'ר בבסיס המחשוב המהימן (TCB). מובלעות מאובטחות נועדו להבטיח שגם משתמשים עם גישה פיזית או גישת שורש למכונות ולמערכת ההפעלה לא יוכלו לדעת את התוכן של הזיכרון במובלעת המאובטחת או לשנות את ההרצה של הקוד בתוך המובלעת. דוגמה למובלעת מאובטחת היא Intel Software Guard Extension ‏ (SGX).

Confidential VMs ויחידות GPU סודיות

מכונה וירטואלית חסויה היא סוג של מכונה וירטואלית שמשתמשת בהצפנת זיכרון מבוססת-חומרה כדי להגן על נתונים ועל אפליקציות. מכונה וירטואלית חסויה מציעה בידוד ואימות כדי לשפר את האבטחה. טכנולוגיות המחשוב של מכונות וירטואליות חסויות כוללות AMD SEV,‏ AMD SEV-SNP,‏ Intel TDX,‏ Arm CCA,‏ IBM Z,‏ IBM LinuxONE ו-Nvidia Confidential GPU.

מעבדים גרפיים (GPU) סודיים עוזרים להגן על הנתונים ולזרז את המחשוב, במיוחד בסביבות ענן ובסביבות משותפות. הם משתמשים בטכניקות הצפנה ובידוד מבוססות חומרה כדי להגן על הנתונים בזמן העיבוד ב-GPU, וכך מוודאים שאפילו ספק שירותי הענן או גורמים זדוניים לא יכולים לגשת למידע רגיש.

תרחישים לדוגמה לניתוח נתונים חסויים, ל-AI וללמידה משותפת (Federated)

בקטעים הבאים מופיעות דוגמאות לתרחישי שימוש במחשוב חסוי בתעשיות שונות.

בריאות ומדעי החיים

השימוש בטכנולוגיית Confidential Computing מאפשר שיתוף וניתוח מאובטחים של נתונים בין ארגונים, תוך שמירה על פרטיות המטופלים. השימוש בטכנולוגיית Confidential Computing מאפשר לארגוני בריאות להשתתף במחקרים שיתופיים, במידול של מחלות, בגילוי תרופות ובתכניות טיפול בהתאמה אישית.

בטבלה הבאה מתוארות כמה דוגמאות לשימוש ב-Confidential Computing בתחום הבריאות.

תרחיש שימוש תיאור

חיזוי מחלות וגילוי מוקדם

בתי חולים מאמנים מודל של למידה מאוחדת כדי לזהות נגעים סרטניים מנתוני הדמיה רפואית (לדוגמה, סריקות MRI או סריקות CT בכמה בתי חולים או באזורים שונים של בתי חולים), תוך שמירה על סודיות המטופלים.

מעקב אחרי מטופלים בזמן אמת

ספקי שירותי בריאות מנתחים נתונים ממכשירים לבישים לניטור הבריאות ומאפליקציות בריאות לנייד כדי לספק ניטור והתראות בזמן אמת. לדוגמה, מכשירים לבישים אוספים נתונים על רמות הגלוקוז, הפעילות הגופנית והרגלי התזונה כדי לספק המלצות מותאמות אישית והתראות מוקדמות על תנודות ברמת הסוכר בדם.

גילוי תרופות בשיתוף פעולה

חברות תרופות מאמנות מודלים על מערכי נתונים קנייניים כדי להאיץ את תהליך גילוי התרופות, לשפר את שיתוף הפעולה ולהגן על קניין רוחני.

שירותים פיננסיים

השימוש בטכנולוגיית מחשוב חסוי מאפשר למוסדות פיננסיים ליצור מערכת פיננסית מאובטחת ועמידה יותר.

בטבלה הבאה מתוארות כמה דוגמאות לשימוש ב-Confidential Computing בשירותים פיננסיים.

תרחיש שימוש תיאור

פשעים פיננסיים

מוסדות פיננסיים יכולים לשתף פעולה במאמצים למניעת הלבנת הון (AML) או במודלים כלליים למניעת הונאה, על ידי שיתוף מידע על עסקאות חשודות תוך שמירה על פרטיות הלקוחות. באמצעות מחשוב חסוי, מוסדות יכולים לנתח את הנתונים המשותפים בצורה מאובטחת, ולאמן את המודלים לזהות ולשבש תוכניות מורכבות להלבנת הון בצורה יעילה יותר.

הערכת סיכוני אשראי תוך שמירה על הפרטיות

מלווים יכולים להעריך את סיכון האשראי באמצעות מגוון רחב יותר של מקורות נתונים, כולל נתונים ממוסדות פיננסיים אחרים או אפילו מישויות לא פיננסיות. באמצעות מחשוב חסוי, מלווים יכולים לגשת לנתונים האלה ולנתח אותם בלי לחשוף אותם לגורמים לא מורשים, וכך לשפר את הדיוק של מודלים לדירוג אשראי תוך שמירה על פרטיות הנתונים.

גילוי מחירים תוך שמירה על הפרטיות

בעולם הפיננסי, במיוחד בתחומים כמו שווקים לא רשמיים או נכסים לא נזילים, תמחור מדויק הוא קריטי. בעזרת Confidential computing, כמה מוסדות יכולים לחשב מחירים מדויקים בשיתוף פעולה, בלי לחשוף זה לזה את המידע האישי הרגיש שלהם.

המגזר הציבורי

מחשוב חסוי מאפשר לממשלות ליצור שירותים שקופים, יעילים ואפקטיביים יותר, תוך שמירה על השליטה והריבונות בנתונים שלהן.

בטבלה הבאה מתוארים כמה שימושים לדוגמה ב-Confidential Computing במגזר הציבורי.

תרחיש שימוש תיאור

ריבונות דיגיטלית

הטכנולוגיה Confidential Computing מבטיחה שהנתונים תמיד מוצפנים, גם בזמן העיבוד. הפתרון מאפשר לבצע העברות מאובטחות לענן של נתונים של אזרחים, והנתונים מוגנים גם כשהם מתארחים בתשתית חיצונית, בסביבות היברידיות, ציבוריות או מרובות עננים. Confidential Computing תומך ומעצים ריבונות דיגיטלית ואוטונומיה דיגיטלית, עם שליטה נוספת בנתונים והגנה על נתונים בשימוש, כך שמפתחות ההצפנה אינם נגישים לספק שירותי הענן.

ניתוח נתונים סודיים של כמה סוכנויות

מחשוב חסוי מאפשר ניתוח נתונים של כמה צדדים בכמה סוכנויות ממשלתיות (לדוגמה, בריאות, מיסים וחינוך), או בכמה ממשלות באזורים או במדינות שונות. מחשוב חסוי עוזר להבטיח שהגבולות של אמון ופרטיות הנתונים מוגנים, תוך שהוא מאפשר ניתוח נתונים (באמצעות מניעת אובדן נתונים (DLP), ניתוח נתונים בקנה מידה גדול ומנועי מדיניות), אימון של AI והצגה של תוצאות AI.

‫AI מהימן

נתונים ממשלתיים הם קריטיים, ואפשר להשתמש בהם כדי לאמן מודלים פרטיים של AI בצורה מהימנה, במטרה לשפר שירותים פנימיים ואינטראקציות עם אזרחים. השימוש בטכנולוגיית Confidential Computing מאפשר ליצור מסגרות מהימנות של AI, עם הנחיות סודיות או אימון סודי של RAG (שליפה משופרת גנרטיבית), כדי לשמור על נתונים ומודלים של אזרחים פרטיים ומאובטחים.

שרשרת אספקה

‫Confidential computing מאפשר לארגונים לנהל את שרשרת האספקה והקיימות שלהם, לשתף פעולה ולחלוק תובנות תוך שמירה על פרטיות הנתונים.

בטבלה הבאה מתוארות כמה דוגמאות לשימוש ב-Confidential Computing בשרשרות אספקה.

תרחיש שימוש תיאור

תחזית ביקוש ואופטימיזציה של מלאי

באמצעות מחשוב חסוי, כל עסק מאמן מודל משלו לחיזוי הביקוש על סמך נתוני המכירות והמלאי שלו. לאחר מכן, המודלים האלה מצורפים בצורה מאובטחת למודל גלובלי, שמספק תמונה מדויקת והוליסטית יותר של דפוסי הביקוש לאורך שרשרת האספקה.

הערכת סיכונים אצל ספקים תוך שמירה על הפרטיות

כל ארגון שמשתתף בהערכת סיכונים של ספקים (לדוגמה, קונים, מוסדות פיננסיים ומבקרים) מאמן מודל משלו להערכת סיכונים על הנתונים שלו. המודלים האלה מצטברים ליצירת פרופיל סיכונים מקיף של ספקים ששומר על הפרטיות. כך אפשר לזהות מוקדם סיכונים פוטנציאליים של ספקים, לשפר את עמידות שרשרת האספקה ולקבל החלטות טובות יותר בבחירה ובניהול של ספקים.

מעקב אחרי טביעת הרגל הפחמנית והפחתה שלה

הפתרון לבעיות שקשורות לפרטיות ולשקיפות של נתונים במעקב אחר טביעת רגל פחמנית ובמאמצים להפחתתה הוא Confidential computing (מחשוב חסוי). מחשוב חסוי מאפשר לארגונים לשתף ולנתח נתונים בלי לחשוף את הצורה הגולמית שלהם, וכך לקבל החלטות מושכלות ולפעול בצורה יעילה כדי ליצור עתיד בר-קיימא יותר.

פרסום בדיגיטל

הפרסום הדיגיטלי כבר לא מסתמך על קובצי Cookie של צד שלישי, ועובר לשימוש בחלופות ששומרות על הפרטיות, כמו ארגז החול לפרטיות. ארגז החול לפרטיות תומך בתרחישי שימוש חשובים בפרסום, תוך הגבלת המעקב באתרים ובאפליקציות. ארגז החול לפרטיות משתמש בסביבות TEE כדי להבטיח עיבוד מאובטח של נתוני המשתמשים על ידי חברות פרסום.

אפשר להשתמש ב-TEEs בתרחישי השימוש הבאים בפרסום דיגיטלי:

  • אלגוריתמים להתאמה: מציאת התאמות או קשרים בתוך מערכי נתונים.
  • שיוך: קישור של אפקטים או אירועים לסיבות האפשריות שלהם.
  • צבירת נתונים: חישוב סיכומים או נתונים סטטיסטיים מנתוני הגולמי.

הטמעה של Confidential Computing ב- Google Cloud

‫Google Cloud כולל את השירותים הבאים שמאפשרים מחשוב חסוי:

  • Confidential VM: הפעלת הצפנה של נתונים בשימוש בעומסי עבודה שמשתמשים במכונות וירטואליות
  • Confidential GKE: הפעלת הצפנה של נתונים בשימוש עבור עומסי עבודה שמשתמשים במאגרי מידע
  • Confidential Dataflow: הפעלת הצפנה של נתונים בשימוש לצורך ניתוח סטרימינג ולמידת מכונה
  • Confidential Dataproc: הפעלת הצפנה של נתונים בשימוש לעיבוד נתונים
  • Confidential Space: הפעלת הצפנה של נתונים בשימוש לצורך ניתוח נתונים משותף ולמידת מכונה

השירותים האלה מאפשרים לצמצם את גבול האמון כך שפחות משאבים יוכלו לגשת לנתונים הסודיים. לדוגמה, בסביבה Google Cloudללא Confidential Computing, גבול האמון כולל את התשתית (חומרה, hypervisor ומערכת הפעלה של המארח) ואת מערכת ההפעלה של האורח. בסביבה Google Cloud שכוללת Confidential Computing (ללא Confidential Space), גבול האמון כולל רק את מערכת ההפעלה של האורח ואת האפליקציה. בסביבה Google Cloudעם Confidential Space, גבול האמון כולל רק את האפליקציה ואת מרחב הזיכרון שמשויך אליה. בטבלה הבאה אפשר לראות איך גבול האמון מצטמצם באמצעות Confidential Computing ו-Confidential Space.Google Cloud

רכיבים בתוך גבולות האמון בלי להשתמש ב-Confidential Computing בתוך גבולות האמון כשמשתמשים ב-Confidential Computing בתוך גבולות האמון כשמשתמשים ב-Confidential Space

חבילת Cloud ואדמינים

כן

לא

לא

‫BIOS וקושחה

כן

לא

לא

מערכת ההפעלה של המארח וה-hypervisor

כן

לא

לא

אדמין של מכונה וירטואלית (VM) אורחת

כן

כן

לא

מערכת הפעלה אורחת של VM

כן

כן

כן, נמדד ומאומת

אפליקציות

כן

כן

כן, נמדד ומאומת

מידע סודי

כן

כן

כן

Confidential Space יוצר אזור מאובטח במכונה וירטואלית כדי לספק את הרמה הגבוהה ביותר של בידוד והגנה למידע אישי רגיש ולאפליקציות. היתרונות העיקריים של Confidential Space מבחינת אבטחה כוללים:

  • הגנה מעמיקה: מוסיפה עוד שכבת אבטחה מעל טכנולוגיות קיימות של מחשוב חסוי.
  • צמצום שטח ההתקפה: בידוד האפליקציות מפגיעויות פוטנציאליות במערכת ההפעלה של האורח.
  • שליטה משופרת: שליטה פרטנית בגישה ובהרשאות בסביבה המאובטחת.
  • אמינות גבוהה יותר: מספקת רמת ביטחון גבוהה יותר לגבי סודיות ושלמות הנתונים.

‏Confidential Space נועד לטיפול בעומסי עבודה רגישים במיוחד, במיוחד בתעשיות מפוקחות או בתרחישים שכוללים שיתופי פעולה בין כמה צדדים שבהם פרטיות הנתונים היא בעלת חשיבות עליונה.

דוגמאות לארכיטקטורות לניתוח נתונים סודיים, ל-AI וללמידה משותפת

אתם יכולים להטמיע מחשוב חסוי ב- Google Cloud כדי לטפל בתרחישי השימוש הבאים:

  • ניתוח נתונים סודי
  • Confidential AI
  • למידה משותפת (Federated) חסויה

בקטעים הבאים מפורט מידע נוסף על הארכיטקטורה של תרחישי השימוש האלה, כולל דוגמאות לעסקים בתחום הפיננסי ובתחום הבריאות.

ארכיטקטורה של ניתוח נתונים סודי למוסדות בתחום הבריאות

ארכיטקטורת הניתוח הסודית מדגימה איך כמה מוסדות בתחום הבריאות (כמו ספקי שירותי בריאות, חברות ביו-פרמצבטיות ומוסדות מחקר) יכולים לעבוד יחד כדי להאיץ את המחקר בתחום התרופות. בארכיטקטורה הזו נעשה שימוש בטכניקות של מחשוב סודי כדי ליצור חדר נקי דיגיטלי להפעלת ניתוח סודי שיתופי.

לארכיטקטורה הזו יש את היתרונות הבאים:

  • תובנות משופרות: ניתוח שיתופי מאפשר לארגוני בריאות לקבל תובנות רחבות יותר ולקצר את זמן יציאה לשוק של תרופות חדשות.
  • פרטיות נתונים: נתוני עסקאות רגישים נשארים מוצפנים ואף פעם לא נחשפים למשתתפים אחרים או ל-TEE, כדי להבטיח סודיות.
  • תאימות לתקנות: הארכיטקטורה עוזרת למוסדות בריאות לעמוד בתקנות להגנה על נתונים, על ידי שמירה על שליטה קפדנית בנתונים שלהם.
  • אמון ושיתוף פעולה: הארכיטקטורה מאפשרת שיתוף פעולה מאובטח בין מוסדות מתחרים, ומעודדת מאמץ משותף לגילוי תרופות.

התרשים הבא מציג את הארכיטקטורה הזו.

תרשים של ארכיטקטורת ניתוח נתונים סודית למוסדות בתחום הבריאות.

הרכיבים העיקריים בארכיטקטורה הזו כוללים את:

  • שרת צבירת OLAP של TEE: סביבה מאובטחת ומבודדת שבה מתבצעים אימון של מודלים של למידת מכונה והסקת מסקנות. הנתונים והקוד ב-TEE מוגנים מפני גישה לא מורשית, גם ממערכת ההפעלה הבסיסית או מספק שירותי הענן.
  • שותפים לשיתוף פעולה: לכל מוסד בריאות משתתף יש סביבה מקומית שמשמשת כמתווכת בין הנתונים הפרטיים של המוסד לבין TEE.
  • נתונים מוצפנים שספציפיים לספק: כל מוסד רפואי מאחסן נתונים פרטיים ומוצפנים של מטופלים, כולל רשומות רפואיות אלקטרוניות. הנתונים האלה נשארים מוצפנים במהלך תהליך הניתוח, וכך מובטחת פרטיות הנתונים. הנתונים נשלחים ל-TEE רק אחרי אימות הצהרות האימות מהספקים השונים.
  • לקוח Analytics: מוסדות בריאות משתתפים יכולים להריץ שאילתות סודיות על הנתונים שלהם כדי לקבל תובנות מיידיות.

ארכיטקטורת AI חסויה למוסדות פיננסיים

דוגמה זו לארכיטקטורה מדגימה כיצד מוסדות פיננסיים יכולים לאמן יחד מודל לזיהוי הונאות, תוך שימוש בתוויות הונאה כדי לשמור על הסודיות של נתוני העסקאות הרגישים שלהם. הארכיטקטורה משתמשת בטכניקות של Confidential Computing כדי לאפשר למידת מכונה מאובטחת של כמה גורמים.

לארכיטקטורה הזו יש את היתרונות הבאים:

  • זיהוי הונאות משופר: אימון שיתופי משתמש במערך נתונים גדול ומגוון יותר, וכתוצאה מכך מודל זיהוי ההונאות מדויק ויעיל יותר.
  • פרטיות נתונים: נתוני עסקאות רגישים נשארים מוצפנים ואף פעם לא נחשפים למשתתפים אחרים או ל-TEE, כדי להבטיח סודיות.
  • תאימות לתקנות: הארכיטקטורה עוזרת למוסדות פיננסיים לעמוד בתקנות להגנה על נתונים באמצעות שמירה על שליטה קפדנית בנתונים שלהם.
  • אמון ושיתוף פעולה: הארכיטקטורה הזו מאפשרת שיתוף פעולה מאובטח בין מוסדות מתחרים, ומעודדת מאמץ משותף למאבק בהונאות פיננסיות.

התרשים הבא מציג את הארכיטקטורה הזו.

תרשים של ארכיטקטורת ניתוח נתונים סודית למוסדות פיננסיים.

הרכיבים העיקריים בארכיטקטורה הזו כוללים את הפריטים הבאים:

  • שרת צבירת OLAP של TEE: סביבה מאובטחת ומבודדת שבה מתבצעים אימון של מודלים של למידת מכונה והסקת מסקנות. הנתונים והקוד ב-TEE מוגנים מפני גישה לא מורשית, גם ממערכת ההפעלה הבסיסית או מספק שירותי הענן.
  • אימון מודלים של TEE: מודל הבסיס הגלובלי לזיהוי הונאות נארז כקונטיינרים כדי להפעיל את אימון ה-ML. בתוך סביבת ה-TEE, המודל הגלובלי עובר אימון נוסף באמצעות הנתונים המוצפנים מכל הבנקים המשתתפים. תהליך האימון משתמש בטכניקות כמו למידה מאוחדת (Federated) או חישוב רב-משתתפים כדי להבטיח שלא ייחשפו נתונים גולמיים.
  • שותפים משתפי פעולה: לכל מוסד פיננסי משתתף יש סביבה מקומית שמשמשת כמתווכת בין הנתונים הפרטיים של המוסד לבין TEE.
  • נתונים מוצפנים שספציפיים לבנק: כל בנק מחזיק בנתוני עסקאות פרטיים ומוצפנים משלו, שכוללים תוויות של הונאות. הנתונים האלה נשארים מוצפנים לאורך כל התהליך, כדי להבטיח את פרטיות הנתונים. הנתונים נשלחים ל-TEE רק אחרי אימות הצהרות האימות מהבנקים השונים.
  • מאגר מודלים: מודל מאומן מראש לזיהוי הונאות, שמשמש כנקודת התחלה לאימון שיתופי.
  • מודל ומשקלים מאומנים לזיהוי הונאות ברמה גלובלית (מסומנים בקו הירוק): מודל משופר לזיהוי הונאות, יחד עם המשקלים שנלמדו, מועבר באופן מאובטח בחזרה לבנקים המשתתפים. לאחר מכן הם יכולים לפרוס את המודל המשופר הזה באופן מקומי כדי לזהות הונאות בעסקאות שלהם.

ארכיטקטורה של למידה משותפת (Federated) חסויה למוסדות פיננסיים

למידה משותפת (Federated) היא פתרון מתקדם ללקוחות שחשוב להם לשמור על פרטיות הנתונים ועל ריבונות הנתונים. ארכיטקטורת הלמידה המשותפת (Federated) החסויה מספקת דרך מאובטחת, יעילה וניתנת להרחבה להשתמש בנתונים עבור אפליקציות AI. הארכיטקטורה הזו מביאה את המודלים למיקום שבו הנתונים מאוחסנים, במקום לרכז את הנתונים במיקום יחיד, וכך מצמצמת את הסיכונים שקשורים לדליפת נתונים.

דפוס ארכיטקטוני זה מדגים כיצד מוסדות פיננסיים מרובים יכולים לאמן יחד מודל לזיהוי הונאות, תוך שמירה על סודיות נתוני העסקאות הרגישים שלהם עם תוויות הונאה. התכונה הזו משתמשת בלמידה מאוחדת (Federated Learning) ובטכניקות של Confidential Computing (עיבוד נתונים מאובטח) כדי לאפשר למידת מכונה מאובטחת של כמה צדדים בלי להעביר נתוני אימון.

לארכיטקטורה הזו יש את היתרונות הבאים:

  • פרטיות ואבטחה משופרות של נתונים: למידת מכונה מאוחדת מאפשרת לשמור על פרטיות הנתונים ועל מיקומם, כי היא מבטיחה שהנתונים הרגישים יישארו בכל אתר. בנוסף, מוסדות פיננסיים יכולים להשתמש בטכניקות לשמירה על הפרטיות, כמו הצפנה הומומורפית ומסנני פרטיות דיפרנציאלית, כדי להגן עוד יותר על נתונים שמועברים (כמו משקלי המודל).
  • דיוק ומגוון משופרים: באמצעות אימון עם מגוון מקורות נתונים בקרב לקוחות שונים, מוסדות פיננסיים יכולים לפתח מודל גלובלי חזק וניתן להכללה, כדי לייצג טוב יותר מערכי נתונים הטרוגניים.
  • יכולת הרחבה ויעילות הרשת: היכולת לבצע אימון בקצה הרשת מאפשרת למוסדות להרחיב את הלמידה המשותפת ברחבי העולם. בנוסף, המוסדות צריכים להעביר רק את משקלי המודל ולא את מערכי הנתונים המלאים, מה שמאפשר שימוש יעיל במשאבי הרשת.

התרשים הבא מציג את הארכיטקטורה הזו.

תרשים של ארכיטקטורת למידה משותפת סודית.

הרכיבים העיקריים בארכיטקטורה הזו כוללים את הפריטים הבאים:

  • שרת מאוחד באשכול TEE: סביבה מאובטחת ומבודדת שבה שרת הלמידה המשותפת מתאם את שיתוף הפעולה של כמה לקוחות. לשם כך, הוא שולח קודם מודל ראשוני ללקוחות הלמידה המשותפת. הלקוחות מבצעים אימון על מערכי הנתונים המקומיים שלהם, ואז שולחים את עדכוני המודל בחזרה לשרת של למידה מאוחדת לצורך צבירה, כדי ליצור מודל גלובלי.
  • מאגר מודלים של למידה משותפת: מודל מוכן מראש לזיהוי הונאות שמשמש כנקודת התחלה ללמידה משותפת.
  • מנוע הסקה של אפליקציה מקומית: אפליקציה שמבצעת משימות, חישובים מקומיים ולמידה באמצעות מערכי נתונים מקומיים, ושולחת את התוצאות בחזרה לשרת של למידה מאוחדת לצורך צבירה מאובטחת.
  • נתונים פרטיים מקומיים: כל בנק מחזיק בנתוני עסקאות פרטיים מוצפנים משלו, שכוללים תוויות של הונאות. הנתונים האלה נשארים מוצפנים לאורך כל התהליך, כדי להבטיח את פרטיות הנתונים.
  • פרוטוקול של צבירה מאובטחת (מסומן בקו הכחול המקווקו): כדי לאמן את המודל, שרת הלמידה המאוחדת לא צריך לגשת לעדכון של אף בנק בודד. הוא צריך רק את הממוצעים המשוקללים של וקטורי העדכון, שנלקחים מקבוצת משנה אקראית של בנקים או אתרים. שימוש בפרוטוקול צבירה מאובטח לחישוב הממוצעים המשוקללים האלה עוזר להבטיח שהשרת יוכל ללמוד רק שאחד או יותר בנקים בקבוצת המשנה שנבחרה באופן אקראי כתבו מילה מסוימת, אבל לא אילו בנקים, וכך לשמור על הפרטיות של כל משתתף בתהליך הלמידה המאוחדת.
  • מודל גלובלי שאומן לזיהוי הונאות ומשקלים מצטברים (מסומן בקו הירוק): המודל המשופר לזיהוי הונאות, יחד עם המשקלים שנלמדו, נשלח בחזרה באופן מאובטח לבנקים המשתתפים. לאחר מכן, הבנקים יכולים לפרוס את המודל המשופר הזה באופן מקומי כדי לזהות הונאות בעסקאות שלהם.

המאמרים הבאים

שותפים ביצירת התוכן