אזורי AI

במסמך הזה מפורטת סקירה כללית של אזורי AI ל-Cloud Storage. אזורי AI הם אזורים מיוחדים שנועדו לספק קיבולת מחשוב לעומסי עבודה של בינה מלאכותית (AI) ולמידת מכונה (ML). Google Cloud הם מספקים קיבולת משמעותית של מאיץ למידת מכונה (GPU ו-TPU).

אזורי AI מותאמים לעומסי עבודה של AI ו-ML, כמו:

  • אימון בקנה מידה גדול
  • אימון בקנה מידה קטן, כוונון עדין, הסקה בכמות גדולה ואימון מחדש
  • היקש של למידת מכונה בזמן אמת

מידע נוסף על אזורי AI זמין במאמר אזורי AI במאמרי העזרה של Compute Engine.

באזור מסוים, יכול להיות שתחומי AI ממוקמים גיאוגרפית רחוק מתחומים רגילים (לא מבוססי-AI).

אזורי AI תואמים לתכונות אחרות של Cloud Storage ושל Google Cloud

המלצות לגבי ארכיטקטורת אחסון

מומלץ להשתמש בארכיטקטורת אחסון מדורגת כדי לאזן בין עלות, עמידות וביצועים:

  • שכבת אחסון לטווח ארוך: שימוש בקטגוריות אזוריות של Cloud Storage באזורים רגילים לאחסון מתמשך ועמיד מאוד (ה'מקור האמת') של מערכי נתוני האימון ונקודות הביקורת של המודל.

  • שכבת הביצועים: שימוש בשירותי אחסון אזוריים ייעודיים כדי לפעול כמטמון מהיר או כשטח אחסון זמני. הגישה הזו מבטלת את זמן האחזור בין אזורים וממקסמת את קצב העברת הנתונים במהלך משימות פעילות.

כדי לבצע אופטימיזציה של הביצועים של מערכות AI ו-ML באמצעות אזורי AI, מומלץ להשתמש בפתרונות האחסון הבאים:

שירות אחסון תיאור תרחישים לדוגמה
התכונה Anywhere Cache של Cloud Storage

מטמון קריאה אזורי שמגובה על ידי SSD ומנוהל באופן מלא, שמעביר נתונים שנקראים לעיתים קרובות מקטגוריה לאזור ה-AI.

יוצרים מכונה של Anywhere Cache באזור AI עבור קטגוריית המקור האזורית שמכילה את מערכי הנתונים או המודלים לאימון שרוצים להפעיל. כשמשימת האימון קוראת קובץ, הקובץ נטען למטמון המהיר באזור. קריאות עוקבות מוגשות ישירות מהמטמון, בלי לעבור דרך הרשת האזורית. האפשרות הזו אידיאלית לדפוסי גישה לנתונים חוזרים באימון מודלים, ולשירות מודלים עם השהיה נמוכה.

מומלץ ל:

  • עומסי עבודה עם פעולות קריאה רבות
  • אימון מודלים ומילוי בקשות עם זמן אחזור נמוך

לא מומלץ ל:

  • אפליקציות שנדרשת בהן תאימות מלאה ל-POSIX

שיטות מומלצות

כדאי לפעול לפי השיטות המומלצות הבאות לאחסון כשמשתמשים באזורי AI:

  • הקצאת שכבת הביצועים באותו אזור AI שבו נמצאים משאבי המחשוב. מיקום משותף של מחשוב ואחסון עוזר לוודא שמעבדי GPU ו-TPU נשארים רוויים לחלוטין, וכך ממקסמים את התפוקה (throughput) השימושית.

  • ב-Anywhere Cache, לפני שמתחילים את תקופת האימון הראשונית, צריך לבצע קריאה מראש של מערך הנתונים כדי לאכלס את המטמון שמגובה על ידי SSD או לחמם אותו.

אזורי AI זמינים

בטבלה הבאה מוצגים אזורי ה-AI והאזורים הראשיים שלהם Google Cloud.

אזור גיאוגרפי אזור הורה אזור AI
ארצות הברית us-central1 us-central1-ai1a
ארצות הברית us-south1 us-south1-ai1b

לתשומת ליבכם

  • אפשר לגשת למוצרים באזור מסוים מאזור ה-AI של האזור. Google Cloud Google Cloud עם זאת, גישה לשירותים באזור Google Cloudמתחום AI עלולה להוסיף חביון לרשת, כי המיקום של תחום ה-AI עשוי להיות נפרד פיזית מהמיקומים של התחומים הרגילים באזור.

  • מומלץ להריץ עומסי עבודה שאינם מבוססי-ML באזורים רגילים ולא באזורים של AI, כי אזורים של AI לא מציעים את כל השירותים באופן מקומי. Google Cloud

המאמרים הבאים