Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

מחשוב סודי לניתוח נתונים, ל-AI וללמידה משותפת

Last reviewed 2024-12-20 UTC

במסמך הזה מופיעה סקירה כללית של מחשוב חסוי, כולל הסבר על האופן שבו אפשר להשתמש בו לשיתוף פעולה מאובטח בנתונים, לאימון מודלים של AI וללמידה מאוחדת. במסמך מופיע גם מידע על שירותי Confidential Computing ב-Google Cloud , וכן הפניות לארכיטקטורות שמתאימות לתרחישי שימוש שונים.

המסמך הזה מיועד למנהלים בתחום הטכנולוגיה, ומטרתו לעזור להם להבין את הפוטנציאל העסקי של מחשוב חסוי עם AI גנרטיבי ו-AI יישומי בתעשיות שונות, כולל שירותים פיננסיים ושירותי בריאות.

מה זה Confidential Computing?

בדרך כלל, נוהלי אבטחת מידע מתמקדים בהגנה על נתונים במנוחה ועל נתונים בזמן העברה באמצעות הצפנה. הטכנולוגיה 'מחשוב חסוי' מוסיפה שכבת הגנה חדשה על ידי טיפול בפגיעות של נתונים במהלך השימוש הפעיל בהם. הטכנולוגיה הזו מבטיחה שמידע רגיש יישאר חסוי גם בזמן העיבוד שלו, וכך עוזרת לסגור פער קריטי באבטחת הנתונים.

סביבת מחשוב חסויה מטמיעה הגנה על נתונים בשימוש באמצעות סביבת מחשוב אמינה (TEE) שמבוססת על חומרה. סביבת מחשוב אמינה (TEE) היא אזור מאובטח במעבד שמגן על הסודיות והתקינות של הקוד והנתונים שנטענים לתוכה. סביבת מחשוב אמינה (TEE) פועלת כחדר בטוח לפעולות רגישות, וכך מצמצמת את הסיכון לנתונים גם אם המערכת נפגעה. באמצעות Confidential Computing, אפשר לשמור על הנתונים מוצפנים בזיכרון במהלך העיבוד.

לדוגמה, אתם יכולים להשתמש ב-Confidential Computing לניתוח נתונים וללמידת מכונה כדי להשיג את המטרות הבאות:

פרטיות משופרת: אפשר לבצע ניתוח של מערכי נתונים רגישים (לדוגמה, רשומות רפואיות או נתונים פיננסיים) בלי לחשוף את הנתונים לתשתית הבסיסית או לצדדים שמעורבים בחישוב.
שיתוף פעולה מאובטח: אפשר לאמן ביחד מודלים של למידת מכונה או לבצע ניתוח של מערכי נתונים משולבים של כמה גורמים בלי לחשוף נתונים פרטיים אחד לשני. השימוש בטכנולוגיית מחשוב חסוי מעודד אמון ומאפשר פיתוח של מודלים חזקים וכלליים יותר, במיוחד בתחומים כמו שירותי בריאות ופיננסים.
אבטחת נתונים משופרת: צמצום הסיכון לפרצות אבטחה ולגישה לא מורשית, כדי להבטיח עמידה בתקנות להגנה על נתונים – כמו התקנה הכללית להגנה על מידע (GDPR) או חוק היבילות ואחריות הדיווח של ביטוח בריאות (HIPAA).
אמון ושקיפות מוגברים: אפשר לספק הוכחה שניתנת לאימות לכך שהחישובים מתבצעים על הנתונים המיועדים ובסביבה מאובטחת, וכך להגביר את האמון בקרב בעלי העניין.

איך פועלת סביבת מחשוב חסוי

סביבות מחשוב חסויות כוללות את המאפיינים הבאים:

הצפנה בזמן ריצה: המעבד שומר על הצפנה של כל הנתונים בסביבת המחשוב הסודי בזיכרון. כל רכיב מערכת או תוקף חומרה שמנסה לקרוא נתונים בסביבת מחשוב חסוי ישירות מהזיכרון, רואה רק נתונים מוצפנים. באופן דומה, ההצפנה מונעת שינוי של נתונים בסביבת מחשוב סודי באמצעות גישה ישירה לזיכרון.
בידוד: המעבד חוסם גישה מבוססת-תוכנה לסביבת המחשוב הסודי. מערכת ההפעלה ואפליקציות אחרות יכולות לתקשר עם סביבת המחשוב החסוי רק דרך ממשקים ספציפיים.
אימות: בהקשר של Confidential Computing, אימות מוודא את מהימנות סביבת Confidential Computing. באמצעות אימות, המשתמשים יכולים לראות את ההוכחה לכך ש-Confidential Computing מגן על הנתונים שלהם, כי האימות מאפשר לאמת את מופע ה-TEE.

במהלך תהליך האימות, שבב ה-CPU שתומך ב-TEE יוצר דוח חתום קריפטוגרפית (שנקרא דוח אימות) של המדידה של המופע. לאחר מכן, המדידה נשלחת לשירות אימות. אישור לבידוד תהליכים מאמת אפליקציה. אישור לבידוד מכונות וירטואליות מאמת מכונה וירטואלית, את הקושחה הווירטואלית שמשמשת להפעלת המכונה הווירטואלית או את שניהם.
אבטחה של מחזור החיים של הנתונים: Confidential Computing יוצר סביבת עיבוד מאובטחת כדי לספק הגנה על נתונים בשימוש שמגובה בחומרה.

טכנולוגיית Confidential Computing

הטכנולוגיות הבאות מאפשרות שימוש ב-Confidential Computing:

אזורים מאובטחים, שנקראים גם מחשוב סודי מבוסס-אפליקציה
‫Confidential VMs ו-GPU, שנקראים גם VM-based confidential computing

‫Google Cloud משתמש ב-Confidential VM כדי להפעיל מחשוב חסוי. מידע נוסף זמין במאמר בנושא הטמעה של Confidential Computing ב-Google Cloud.

Secure enclaves

אזור מאובטח הוא סביבת מחשוב שמספקת בידוד לקוד ולנתונים ממערכת ההפעלה באמצעות בידוד מבוסס-חומרה, או בידוד של מכונה וירטואלית שלמה על ידי הצבת ה-hypervisor בבסיס המחשוב המהימן (TCB). הסביבות המבודדות המאובטחות נועדו להבטיח שגם משתמשים עם גישה פיזית או גישת שורש למכונות ולמערכת ההפעלה לא יוכלו לגלות את התוכן של הזיכרון בסביבה המבודדת המאובטחת או לשנות את הביצוע של הקוד בתוך הסביבה המבודדת. דוגמה למובלעת מאובטחת היא Intel Software Guard Extension ‏ (SGX).

‫Confidential VMs ו-Confidential GPUs

מכונה וירטואלית (VM) חסויה היא סוג של מכונה וירטואלית שמשתמשת בהצפנת זיכרון מבוססת-חומרה כדי להגן על נתונים ועל אפליקציות. מכונה וירטואלית חסויה מציעה בידוד ואימות כדי לשפר את האבטחה. טכנולוגיות מחשוב של Confidential VM כוללות את AMD SEV,‏ AMD SEV-SNP,‏ Intel TDX,‏ Arm CCA,‏ IBM Z,‏ IBM LinuxONE ו-Nvidia Confidential GPU.

מעבדים גרפיים (GPU) סודיים עוזרים להגן על הנתונים ולזרז את המחשוב, במיוחד בסביבות ענן ובסביבות משותפות. הם משתמשים בטכניקות הצפנה ובידוד מבוססות חומרה כדי להגן על הנתונים בזמן העיבוד ב-GPU, וכך מוודאים שאפילו ספק שירותי הענן או גורמים זדוניים לא יכולים לגשת למידע רגיש.

תרחישי שימוש בניתוח נתונים סודיים, ב-AI ובלמידה משותפת

בקטעים הבאים מופיעות דוגמאות לתרחישי שימוש במחשוב חסוי בתעשיות שונות.

בריאות ומדעי החיים

השימוש ב-Confidential Computing מאפשר שיתוף וניתוח מאובטחים של נתונים בין ארגונים, תוך שמירה על פרטיות המטופלים. השימוש בטכנולוגיית Confidential Computing מאפשר לארגוני בריאות להשתתף במחקרים שיתופיים, במידול של מחלות, בגילוי תרופות ובתכניות טיפול בהתאמה אישית.

בטבלה הבאה מתוארות כמה דוגמאות לשימוש ב-Confidential Computing בתחום הבריאות.

תרחיש שימוש	תיאור
חיזוי מחלות וגילוי מוקדם	בתי חולים מאמנים מודל של למידה מאוחדת כדי לזהות נגעים סרטניים מנתוני הדמיה רפואית (לדוגמה, סריקות MRI או סריקות CT בכמה בתי חולים או אזורים של בתי חולים) תוך שמירה על סודיות המטופלים.
מעקב אחרי מטופלים בזמן אמת	ספקי שירותי בריאות מנתחים נתונים ממכשירי בריאות לבישים ומאפליקציות בריאות לנייד כדי לקבל התראות ונתונים לניטור בזמן אמת. לדוגמה, מכשירים לבישים אוספים נתונים על רמות הגלוקוז, הפעילות הגופנית והרגלי התזונה כדי לספק המלצות מותאמות אישית ואזהרות מוקדמות לגבי תנודות ברמת הסוכר בדם.
גילוי תרופות בשיתוף פעולה	חברות תרופות מאמנות מודלים על מערכי נתונים קנייניים כדי להאיץ את תהליך גילוי התרופות, לשפר את שיתוף הפעולה ולהגן על קניין רוחני.

שירותים פיננסיים

השימוש בטכנולוגיית מחשוב חסוי מאפשר למוסדות פיננסיים ליצור מערכת פיננסית מאובטחת ועמידה יותר.

בטבלה הבאה מתוארות כמה דוגמאות לשימוש ב-Confidential Computing בשירותים פיננסיים.

תרחיש שימוש	תיאור
פשעים פיננסיים	מוסדות פיננסיים יכולים לשתף פעולה במאמצים למניעת הלבנת הון (AML) או במודלים כלליים למניעת תרמיות, על ידי שיתוף מידע על עסקאות חשודות תוך שמירה על פרטיות הלקוחות. באמצעות Confidential Computing, מוסדות יכולים לנתח את הנתונים המשותפים בצורה מאובטחת, ולאמן את המודלים לזהות ולשבש תוכניות מורכבות להלבנת הון בצורה יעילה יותר.
הערכת סיכוני אשראי תוך שמירה על הפרטיות	מלווים יכולים להעריך את סיכון האשראי באמצעות מגוון רחב יותר של מקורות נתונים, כולל נתונים ממוסדות פיננסיים אחרים או אפילו מישויות לא פיננסיות. באמצעות מחשוב חסוי, מלווים יכולים לגשת לנתונים האלה ולנתח אותם בלי לחשוף אותם לגורמים לא מורשים, וכך לשפר את הדיוק של מודלים לדירוג אשראי תוך שמירה על פרטיות הנתונים.
גילוי מחירים תוך שמירה על הפרטיות	בעולם הפיננסי, במיוחד בתחומים כמו שווקים לא רשמיים או נכסים לא נזילים, תמחור מדויק הוא קריטי. בעזרת Confidential computing, כמה מוסדות יכולים לחשב מחירים מדויקים בשיתוף פעולה, בלי לחשוף זה לזה את המידע האישי הרגיש שלהם.

המגזר הציבורי

מחשוב חסוי מאפשר לממשלות ליצור שירותים שקופים, יעילים ואפקטיביים יותר, תוך שמירה על השליטה והריבונות בנתונים שלהן.

בטבלה הבאה מתוארים כמה שימושים לדוגמה ב-Confidential Computing במגזר הציבורי.

תרחיש שימוש	תיאור
ריבונות דיגיטלית	הטכנולוגיה Confidential Computing מבטיחה שהנתונים תמיד מוצפנים, גם בזמן העיבוד. הפתרון מאפשר לבצע העברות מאובטחות לענן של נתונים של אזרחים, והנתונים מוגנים גם כשהם מתארחים בתשתית חיצונית, בסביבות היברידיות, ציבוריות או מרובות עננים. Confidential Computing תומך ומעצים ריבונות דיגיטלית ואוטונומיה דיגיטלית, עם שליטה נוספת בנתונים והגנה על נתונים בשימוש, כך שמפתחות ההצפנה אינם נגישים לספק שירותי הענן.
ניתוח נתונים סודיים של כמה סוכנויות	השימוש בטכנולוגיית מחשוב חסוי מאפשר ניתוח נתונים של כמה גורמים בכמה סוכנויות ממשלתיות (לדוגמה, בתחומי הבריאות, המיסוי והחינוך) או בכמה ממשלות באזורים או במדינות שונות. השימוש בטכנולוגיית Confidential computing עוזר להבטיח שהגבולות של האמון ופרטיות נתונים מוגנים, וגם מאפשר ניתוח נתונים (באמצעות מניעת אובדן נתונים (DLP), ניתוח נתונים בקנה מידה גדול ומנועי מדיניות), אימון של AI והצגת תוצאות של AI.
AI מהימן	נתונים ממשלתיים הם קריטיים, ואפשר להשתמש בהם כדי לאמן מודלים פרטיים של AI בצורה מהימנה, במטרה לשפר שירותים פנימיים ואינטראקציות עם אזרחים. ‫Confidential computing מאפשר מסגרות מהימנות של AI, עם הנחיות סודיות או אימון סודי של RAG (שליפה מוגברת גנרטיבית), כדי לשמור על נתונים ומודלים של אזרחים פרטיים ומאובטחים.

שרשרת אספקה

‫Confidential Computing מאפשר לארגונים לנהל את שרשרת האספקה והקיימות שלהם, לשתף פעולה ולחלוק תובנות תוך שמירה על פרטיות הנתונים.

בטבלה הבאה מתוארות כמה דוגמאות לשימוש ב-Confidential Computing בשרשרות אספקה.

תרחיש שימוש	תיאור
תחזית ביקוש ואופטימיזציה של מלאי	באמצעות מחשוב חסוי, כל עסק מאמן מודל משלו לחיזוי הביקוש על סמך נתוני המכירות והמלאי שלו. לאחר מכן, המודלים האלה מצורפים בצורה מאובטחת למודל גלובלי, שמספק תמונה מדויקת והוליסטית יותר של דפוסי הביקוש לאורך שרשרת האספקה.
הערכת סיכונים אצל ספקים תוך שמירה על הפרטיות	כל ארגון שמעורב בהערכת סיכונים של ספקים (לדוגמה, קונים, מוסדות פיננסיים ומבקרים) מאמן מודל משלו להערכת סיכונים על הנתונים שלו. המודלים האלה מצטברים ויוצרים פרופיל סיכון מקיף של הספק ששומר על הפרטיות. כך אפשר לזהות מוקדם סיכונים פוטנציאליים של הספק, לשפר את העמידות של שרשרת האספקה ולקבל החלטות טובות יותר בבחירה ובניהול של ספקים.
מעקב אחרי טביעת הרגל הפחמנית והפחתה שלה	הפתרון של מחשוב חסוי מאפשר להתמודד עם האתגרים של פרטיות נתונים ושקיפות במעקב אחר טביעת הרגל הפחמנית ובמאמצים לצמצום שלה. השימוש בטכנולוגיית מחשוב חסוי מאפשר לארגונים לשתף ולנתח נתונים בלי לחשוף את הצורה הגולמית שלהם. כך הארגונים יכולים לקבל החלטות מושכלות ולנקוט פעולות יעילות כדי ליצור עתיד בר-קיימא יותר.

פרסום בדיגיטל

הפרסום הדיגיטלי כבר לא מסתמך על קובצי Cookie של צד שלישי, ועובר לפתרונות חלופיים ששומרים על הפרטיות, כמו ארגז החול לפרטיות. ארגז החול לפרטיות תומך בתרחישי שימוש חשובים בפרסום, תוך הגבלת המעקב באתרים ובאפליקציות שונות. בארגז החול לפרטיות נעשה שימוש בסביבות מחשוב אמינות כדי להבטיח עיבוד מאובטח של נתוני המשתמשים על ידי חברות פרסום.

אפשר להשתמש ב-TEEs בתרחישי השימוש הבאים בפרסום דיגיטלי:

אלגוריתמים להתאמה: מציאת התאמות או קשרים בתוך מערכי נתונים.
שיוך (Attribution): קישור של אפקטים או אירועים חזרה לסיבות האפשריות שלהם.
צבירת נתונים: חישוב סיכומים או נתונים סטטיסטיים מנתוני הגולמי.

הטמעה של Confidential Computing ב- Google Cloud

‫Google Cloud כולל את השירותים הבאים שמאפשרים מחשוב חסוי:

‫Confidential VM: הפעלת הצפנה של נתונים בשימוש בעומסי עבודה שמשתמשים במכונות וירטואליות
‫Confidential GKE: הפעלת הצפנה של נתונים בשימוש עבור עומסי עבודה שמשתמשים במאגרי מידע
‫Confidential Dataflow: הפעלת הצפנה של נתונים בשימוש לצורך ניתוח סטרימינג ולמידת מכונה
Confidential Dataproc: הפעלת הצפנה של נתונים בשימוש לעיבוד נתונים
Confidential Space: הפעלת הצפנה של נתונים בשימוש לצורך ניתוח נתונים משותף ולמידת מכונה

השירותים האלה מאפשרים לצמצם את גבול האמון כדי שלפחות משאבים תהיה גישה לנתונים הסודיים שלכם. לדוגמה, בסביבה Google Cloud ללא Confidential Computing, גבול האמון כולל את התשתיתGoogle Cloud (חומרה, hypervisor ומערכת הפעלה של המארח) ואת מערכת ההפעלה של האורח. בסביבה Google Cloud שכוללת Confidential Computing (בלי Confidential Space), גבול האמון כולל רק את מערכת ההפעלה של האורח ואת האפליקציה. בסביבה עם Confidential Space, גבול האמון הוא רק האפליקציה ומרחב הזיכרון שמשויך אליה. Google Cloudבטבלה הבאה מוצג איך גבול האמון מצטמצם באמצעות Confidential Computing ו-Confidential Space.

רכיבים	בתוך גבולות האמון בלי להשתמש ב-Confidential Computing	בתוך גבולות האמון כשמשתמשים ב-Confidential Computing	בתוך גבולות האמון כשמשתמשים ב-Confidential Space
חבילת Cloud ואדמינים	כן	לא	לא
‫BIOS וקושחה	כן	לא	לא
מערכת ההפעלה של המארח וה-hypervisor	כן	לא	לא
אדמין אורח של מכונה וירטואלית	כן	כן	לא
מערכת הפעלה של אורח ב-VM	כן	כן	כן, נמדד ומאומת
אפליקציות	כן	כן	כן, נמדד ומאומת
מידע סודי	כן	כן	כן

Confidential Space יוצר אזור מאובטח במכונה וירטואלית כדי לספק את הרמה הגבוהה ביותר של בידוד והגנה למידע אישי רגיש ולאפליקציות. היתרונות העיקריים של Confidential Space מבחינת אבטחה כוללים:

הגנה מעמיקה: מוסיפה עוד שכבת אבטחה מעל טכנולוגיות קיימות של מחשוב חסוי.
שטח פנים קטן יותר להתקפה: מבודד את האפליקציות מפגיעויות פוטנציאליות במערכת ההפעלה של האורח.
שליטה משופרת: שליטה פרטנית בגישה ובהרשאות בסביבה המאובטחת.
מהימנות גבוהה יותר: רמת ביטחון גבוהה יותר לגבי סודיות ושלמות הנתונים.

‏Confidential Space נועד לטיפול בעומסי עבודה רגישים במיוחד, במיוחד בתעשיות מפוקחות או בתרחישים שכוללים שיתופי פעולה בין כמה צדדים שבהם פרטיות הנתונים היא בעלת חשיבות עליונה.

דוגמאות לארכיטקטורות לניתוח נתונים סודיים, ל-AI וללמידה משותפת

אתם יכולים להטמיע מחשוב חסוי ב- Google Cloud כדי לטפל בתרחישי השימוש הבאים:

ניתוח נתונים סודי
Confidential AI
למידה משותפת (Federated) חסויה

בקטעים הבאים מוסבר בהרחבה על הארכיטקטורה של תרחישי השימוש האלה, כולל דוגמאות לעסקים בתחום הפיננסי ובתחום הבריאות.

ארכיטקטורה של ניתוח נתונים סודי למוסדות בתחום הבריאות

ארכיטקטורת הניתוח החסוי מדגימה איך כמה מוסדות בתחום הבריאות (כמו ספקי שירותים, חברות ביו-פרמצבטיקה ומוסדות מחקר) יכולים לעבוד יחד כדי להאיץ את המחקר בתחום התרופות. הארכיטקטורה הזו משתמשת בטכניקות של Confidential Computing כדי ליצור חדר נקי דיגיטלי להרצת ניתוח נתונים שיתופי וחסוי.

לארכיטקטורה הזו יש את היתרונות הבאים:

תובנות משופרות: ניתוח שיתופי מאפשר לארגוני בריאות לקבל תובנות רחבות יותר ולקצר את זמן היציאה לשוק עבור גילוי תרופות משופר.
פרטיות נתונים: נתוני עסקאות רגישים נשארים מוצפנים ואף פעם לא נחשפים למשתתפים אחרים או ל-TEE, כדי להבטיח סודיות.
תאימות לתקנות: הארכיטקטורה עוזרת למוסדות בריאות לעמוד בתקנות להגנה על נתונים, על ידי שמירה על שליטה קפדנית בנתונים שלהם.
אמון ושיתוף פעולה: הארכיטקטורה מאפשרת שיתוף פעולה מאובטח בין מוסדות מתחרים, ומעודדת מאמץ משותף לגילוי תרופות.

התרשים הבא מציג את הארכיטקטורה הזו.

תרשים של ארכיטקטורת ניתוח נתונים חסויים למוסדות בתחום הבריאות.

הרכיבים העיקריים בארכיטקטורה הזו כוללים את:

שרת צבירה של OLAP ב-TEE: סביבה מאובטחת ומבודדת שבה מתבצעים אימון של מודלים של למידת מכונה והסקת מסקנות. הנתונים והקוד ב-TEE מוגנים מפני גישה לא מורשית, גם ממערכת ההפעלה הבסיסית או מספק שירותי הענן.
שותפים לשיתוף פעולה: לכל מוסד בריאות משתתף יש סביבה מקומית שמשמשת כמתווכת בין הנתונים הפרטיים של המוסד לבין TEE.
נתונים מוצפנים ספציפיים לספק: כל מוסד רפואי מאחסן נתונים פרטיים ומוצפנים של מטופלים, שכוללים רשומות רפואיות אלקטרוניות. הנתונים האלה נשארים מוצפנים במהלך תהליך הניתוח, וכך נשמרת פרטיות הנתונים. הנתונים נמסרים ל-TEE רק אחרי אימות הצהרות האימות מהספקים השונים.
לקוח Analytics: מוסדות בריאות משתתפים יכולים להריץ שאילתות סודיות על הנתונים שלהם כדי לקבל תובנות מיידיות.

ארכיטקטורת AI חסויה למוסדות פיננסיים

דוגמה זו לארכיטקטורה מדגימה כיצד מוסדות פיננסיים יכולים לאמן יחד מודל לזיהוי הונאות, תוך שימוש בתוויות הונאה כדי לשמור על הסודיות של נתוני העסקאות הרגישים שלהם. הארכיטקטורה כוללת שימוש בטכניקות של Confidential Computing כדי לאפשר למידת מכונה מאובטחת של כמה גורמים.

לארכיטקטורה הזו יש את היתרונות הבאים:

זיהוי הונאות משופר: אימון שיתופי משתמש במערך נתונים גדול ומגוון יותר, וכך יוצר מודל מדויק ויעיל יותר לזיהוי הונאות.
פרטיות נתונים: נתוני עסקאות רגישים נשארים מוצפנים ואף פעם לא נחשפים למשתתפים אחרים או ל-TEE, כדי להבטיח סודיות.
תאימות לתקנות: הארכיטקטורה עוזרת למוסדות פיננסיים לעמוד בתקנות להגנה על נתונים באמצעות שמירה על שליטה קפדנית בנתונים שלהם.
אמון ושיתוף פעולה: הארכיטקטורה הזו מאפשרת שיתוף פעולה מאובטח בין מוסדות מתחרים, ומעודדת מאמץ משותף למאבק בהונאות פיננסיות.

התרשים הבא מציג את הארכיטקטורה הזו.

תרשים של ארכיטקטורת ניתוח נתונים סודית למוסדות פיננסיים.

הרכיבים העיקריים בארכיטקטורה הזו כוללים את הפריטים הבאים:

שרת צבירה של OLAP ב-TEE: סביבה מאובטחת ומבודדת שבה מתבצעים אימון של מודלים של למידת מכונה והסקת מסקנות. הנתונים והקוד ב-TEE מוגנים מפני גישה לא מורשית, גם ממערכת ההפעלה הבסיסית או מספק שירותי הענן.
אימון מודלים של TEE: מודל הבסיס הגלובלי לזיהוי הונאות נארז כקונטיינרים להפעלת אימון ה-ML. בתוך סביבת ה-TEE, המודל הגלובלי עובר אימון נוסף באמצעות הנתונים המוצפנים מכל הבנקים המשתתפים. תהליך האימון משתמש בטכניקות כמו למידה מאוחדת (Federated) או חישוב מאובטח מרובה משתתפים כדי להבטיח שלא ייחשפו נתונים גולמיים.
שותפים משתפי פעולה: לכל מוסד פיננסי משתתף יש סביבה מקומית שמשמשת כמתווכת בין הנתונים הפרטיים של המוסד לבין סביבת המחשוב האמינה (TEE).
נתונים מוצפנים שספציפיים לבנק: כל בנק מחזיק בנתוני עסקאות פרטיים ומוצפנים משלו, שכוללים תוויות של הונאות. הנתונים האלה נשארים מוצפנים לאורך כל התהליך, כדי להבטיח את פרטיות הנתונים. הנתונים נשלחים ל-TEE רק אחרי אימות הצהרות האימות מהבנקים השונים.
מאגר מודלים: מודל שעבר אימון מראש לזיהוי הונאות, שמשמש כנקודת התחלה לאימון שיתופי.
מודל ומשקלים מאומנים לזיהוי הונאות ברמה גלובלית (מסומנים בקו הירוק): מודל משופר לזיהוי הונאות, יחד עם המשקלים שנלמדו, מועבר באופן מאובטח בחזרה לבנקים המשתתפים. לאחר מכן הם יכולים לפרוס את המודל המשופר הזה באופן מקומי כדי לזהות הונאות בעסקאות שלהם.

ארכיטקטורה של למידה משותפת (Federated) חסויה למוסדות פיננסיים

למידה משותפת (Federated) היא פתרון מתקדם ללקוחות שחשוב להם לשמור על פרטיות הנתונים ועל ריבונות הנתונים. ארכיטקטורת הלמידה המשותפת (Federated) החסויה מספקת דרך מאובטחת, יעילה וניתנת להרחבה להשתמש בנתונים עבור אפליקציות AI. הארכיטקטורה הזו מביאה את המודלים למיקום שבו הנתונים מאוחסנים, במקום לרכז את הנתונים במיקום יחיד, וכך מפחיתה את הסיכונים שקשורים לדליפת נתונים.

דפוס ארכיטקטוני זה מדגים כיצד מוסדות פיננסיים מרובים יכולים לאמן יחד מודל לזיהוי הונאות, תוך שמירה על סודיות נתוני העסקאות הרגישים שלהם עם תוויות הונאה. התכונה הזו משתמשת בלמידה מאוחדת (Federated Learning) ובטכניקות של Confidential Computing (עיבוד נתונים מאובטח) כדי לאפשר למידת מכונה מאובטחת של כמה צדדים בלי להעביר נתוני אימון.

לארכיטקטורה הזו יש את היתרונות הבאים:

פרטיות ואבטחה משופרות של נתונים: למידה משותפת (Federated) מאפשרת לשמור על פרטיות נתונים ועל אחסון ועיבוד נתונים באופן מקומי, כי המידע האישי הרגיש נשאר בכל אתר. בנוסף, מוסדות פיננסיים יכולים להשתמש בטכניקות לשמירה על הפרטיות, כמו הצפנה הומומורפית ומסנני פרטיות דיפרנציאלית, כדי להגן על נתונים שמועברים (למשל משקלי המודל).
שיפור הדיוק והמגוון: באמצעות אימון עם מגוון מקורות נתונים אצל לקוחות שונים, מוסדות פיננסיים יכולים לפתח מודל גלובלי חזק וניתן להכללה, כדי לייצג טוב יותר מערכי נתונים הטרוגניים.
יכולת הרחבה ויעילות הרשת: בעזרת היכולת לבצע אימון בקצה הרשת, מוסדות יכולים להרחיב את הלמידה המאוחדת ברחבי העולם. בנוסף, המוסדות צריכים להעביר רק את משקלי המודל ולא מערכי נתונים שלמים, מה שמאפשר שימוש יעיל במשאבי הרשת.

התרשים הבא מציג את הארכיטקטורה הזו.

דיאגרמה של ארכיטקטורת למידה משותפת (Federated) חסויה.

הרכיבים העיקריים בארכיטקטורה הזו כוללים את הפריטים הבאים:

שרת מאוחד באשכול TEE: סביבה מאובטחת ומבודדת שבה שרת הלמידה המשותפת מתאם את שיתוף הפעולה של כמה לקוחות. לשם כך, הוא שולח קודם מודל ראשוני ללקוחות הלמידה המשותפת. הלקוחות מבצעים אימון על מערכי הנתונים המקומיים שלהם, ואז שולחים את עדכוני המודל בחזרה לשרת של למידה מאוחדת לצורך צבירה, כדי ליצור מודל גלובלי.
מאגר מודלים של למידה משותפת: מודל מוכן מראש לזיהוי הונאות שמשמש כנקודת התחלה ללמידה משותפת.
מנוע הסקה של אפליקציה מקומית: אפליקציה שמבצעת משימות, חישובים מקומיים ולמידה עם מערכי נתונים מקומיים, ושולחת את התוצאות בחזרה לשרת של למידה מאוחדת לצורך צבירה מאובטחת.
נתונים פרטיים מקומיים: כל בנק מחזיק בנתוני עסקאות פרטיים מוצפנים משלו, שכוללים תוויות של הונאות. הנתונים האלה נשארים מוצפנים לאורך כל התהליך, כדי להבטיח את פרטיות הנתונים.
פרוטוקול צבירה מאובטח (מסומן בקו הכחול המקווקו): שרת הלמידה המאוחדת לא צריך לגשת לעדכון של אף בנק כדי לאמן את המודל. הוא צריך רק את הממוצעים המשוקללים של וקטורי העדכון, שנלקחים מקבוצת משנה אקראית של בנקים או אתרים. שימוש בפרוטוקול צבירה מאובטח לחישוב הממוצעים המשוקללים האלה עוזר להבטיח שהשרת יוכל ללמוד רק שאחד או יותר בנקים בקבוצת המשנה שנבחרה באופן אקראי כתבו מילה מסוימת, אבל לא אילו בנקים, וכך לשמור על הפרטיות של כל משתתף בתהליך הלמידה המאוחדת.
מודל גלובלי לאימון נגד הונאות ומשקלים מצטברים (מסומן בקו הירוק): המודל המשופר לזיהוי הונאות, יחד עם המשקלים שנלמדו, נשלח בחזרה לבנקים המשתתפים בצורה מאובטחת. לאחר מכן, הבנקים יכולים לפרוס את המודל המשופר הזה באופן מקומי כדי לזהות הונאות בעסקאות שלהם.

המאמרים הבאים

מומלץ לקרוא את המאמר Confidential AI: Intel seeks to overcome AI's data protection problem (AI סודי: אינטל מנסה לפתור את בעיית הגנת הנתונים של AI).
מומלץ לקרוא את המאמר The Present and Future of Confidential Computing.
צפייה בסרטון Enabling secure multi-party collaboration with confidential computing by Keith Moyer (Google) | OC3 (YouTube).
מה חדש ב-confidential computing? ‫(YouTube).
הטמעה של Confidential Computing ושל Confidential Space בסביבה שלכם.
מידע נוסף על היסודות של Confidential Computing ב-Google Cloud
מידע נוסף על הפעלת AI גנרטיבי פרטי יותר

שותפים ביצירת התוכן

ארון סנתנגופלן | ראש מחלקת הטכנולוגיה והחממה, Google Cloud
פבלו רודריגז | מנהל טכני, Office of CTO
Vineet Dave | Head of Technology and Incubation, Google Cloud

מחשוב סודי לניתוח נתונים, ל-AI וללמידה משותפת קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.

מה זה Confidential Computing?

איך פועלת סביבת מחשוב חסוי

טכנולוגיית Confidential Computing

Secure enclaves

‫Confidential VMs ו-Confidential GPUs

תרחישי שימוש בניתוח נתונים סודיים, ב-AI ובלמידה משותפת

בריאות ומדעי החיים

שירותים פיננסיים

המגזר הציבורי

שרשרת אספקה

פרסום בדיגיטל

הטמעה של Confidential Computing ב- Google Cloud

דוגמאות לארכיטקטורות לניתוח נתונים סודיים, ל-AI וללמידה משותפת

ארכיטקטורה של ניתוח נתונים סודי למוסדות בתחום הבריאות

ארכיטקטורת AI חסויה למוסדות פיננסיים

ארכיטקטורה של למידה משותפת (Federated) חסויה למוסדות פיננסיים

המאמרים הבאים

שותפים ביצירת התוכן

מחשוב סודי לניתוח נתונים, ל-AI וללמידה משותפת