בחירת שיטת אימון

במסמך הזה מוסבר על ההבדלים העיקריים בין שיטות האימון שזמינות ב- Google Cloud. הבחירה תלויה במומחיות של הצוות, ברמת השליטה שאתם צריכים ובהעדפות התשתית שלכם.

  • באמצעות AutoML, אפשר ליצור ולאמן מודל עם מאמץ טכני מינימלי. אתם יכולים להשתמש ב-AutoML כדי ליצור אב-טיפוס של מודלים במהירות ולבדוק מערכי נתונים חדשים לפני שמשקיעים בפיתוח. לדוגמה, אפשר להשתמש בו כדי לגלות אילו תכונות מתאימות הכי טוב למערך נתונים מסוים.

  • באמצעות אימון בהתאמה אישית, אתם יכולים ליצור אפליקציית אימון שעברה אופטימיזציה לתוצאה המטורגטת שלכם. יש לכם שליטה מלאה בפונקציונליות של אפליקציית האימון, החל מעבודות של צומת יחיד ועד לאימון מבוזר מסיבי של כמה צמתים. כלומר, אתם יכולים לטרגט כל יעד, להשתמש בכל אלגוריתם, לפתח פונקציות הפסד או מדדים משלכם, או לבצע כל התאמה אישית אחרת.

    • אימון ללא שרת ב-Vertex AI: זו גישה ללא שרת שבה אתם שולחים את משימת האימון, ו-Vertex AI מקצה, מנהל ומשחרר את משאבי המחשוב בשבילכם. Google Cloud הוא אידיאלי לניסויים ולעבודות שבהן לא נדרשת קיבולת מובטחת.

    • אשכולות אימון של Vertex AI הם תכונה באימון בהתאמה אישית, שנועדה למשימות אימון בהיקפים גדולים ובביצועים גבוהים. הוא מאפשר לכם לשריין אשכול ייעודי של משאבי מחשוב חזקים (כמו מעבדי GPU מסוג A100 או H100) לשימוש בלעדי, וכך להבטיח קיבולת וביצועים למשימות אימון קריטיות ולמשימות אימון ארוכות טווח.

  • עם Ray on Vertex AI אתם יכולים להשתמש במסגרת המחשוב המבוזר של Ray בתשתית של Google Cloud . ‫Ray on Vertex AI מספק סביבה מנוהלת עם משאבי מחשוב שניתנים להגדרה, שילוב עם שירותים כמו Vertex AI Inference ו-BigQuery, ואפשרויות גמישות של רשתות לפיתוח ולהרצה של עומסי עבודה מבוזרים.

  • באמצעות BigQuery, אתם יכולים לאמן מודלים באמצעות הנתונים שלכם ב-BigQuery ישירות ב-BigQuery. באמצעות פקודות SQL, אפשר ליצור במהירות מודל ולהשתמש בו כדי לקבל מסקנות לגבי קבוצות של נתונים.

כדי להשוות בין הפונקציות השונות והמומחיות הנדרשת לכל שירות, אפשר לעיין בטבלה הבאה.

AutoML אימון ללא שרת אשכולות אימון Ray ב-Vertex AI BigQuery ML
נדרש ידע במדעי הנתונים לא כן, כדי לפתח את אפליקציית האימון ולטפל בהכנת הנתונים. כן, כדי לפתח את אפליקציית האימון ולטפל בהכנת הנתונים. מומלץ להכיר את המושגים הבסיסיים של למידת מכונה ואת תהליכי העבודה של הנתונים. לא
נדרשת יכולת תכנות לא. AutoML לא דורש קוד. כן, כדי לפתח את אפליקציית האימון. כן, כדי לפתח את אפליקציית האימון. כן. כן.
זמן אימון המודל נמוך יותר. נדרשת פחות הכנה של נתונים, ואין צורך בפיתוח. גבוה יותר. כולל פיתוח קוד וזמן הקצאת משאבים לפי דרישה לכל משימה. גבוה יותר. התהליך כולל פיתוח קוד, אבל הפעלת העבודה מהירה יותר כי המשאבים כבר הוזמנו, כך שאין צורך להמתין בתור או להקצות משאבים. הזמן שדרוש לאימון תלוי בלוגיקה של הקוד (הכנת נתונים ואימון) ובזמן הקצאת המשאבים. נמוך יותר. פיתוח המודלים מהיר כי BigQuery ML משתמש במנוע החישוב של BigQuery לאימון, להערכה ולהסקת מסקנות.
מגבלות על יעדים של למידת מכונה כן. חובה לטרגט אחד מהיעדים המוגדרים מראש של AutoML. לא לא לא כן
אפשר לבצע אופטימיזציה ידנית של ביצועי המודל באמצעות כוונון היפר-פרמטרים לא. AutoML מבצע כוונון אוטומטי, אבל אי אפשר לשנות את הערכים. כן. במהלך כל הרצת אימון, אפשר לכוונן את המודל לצורך ניסוי והשוואה. כן. במהלך כל הרצת אימון, אפשר לכוונן את המודל לצורך ניסוי והשוואה. כן. אתם מספקים את קוד האימון המותאם אישית, כך שיש לכם שליטה מלאה על ערכי ההיפרפרמטרים. כן. ‫BigQuery ML תומך בכוונון היפרפרמטרים במהלך אימון מודלים.
יכולים לשלוט בהיבטים של סביבת ההדרכה מוגבל. אתם יכולים לציין את התקציב בשעות אימון ולהפעיל עצירה מוקדמת. כן. מציינים את סוג המכונה, גודל הדיסק וקובץ האימג' של הקונטיינר של Compute Engine לכל משימה. כן. אתם מקבלים שליטה מקסימלית, עם אפשרות להזמין סוגים ספציפיים של מכונות בעלות ביצועים גבוהים (לדוגמה, H100s), הגדרות דיסק והגדרות רשת לשימוש בלעדי, וכך להבטיח קיבולת. כן. יש לכם שליטה משמעותית, כולל תמונות Docker בהתאמה אישית, סוגי מכונות לצמתים ראשיים ולצמתים של עובדים, ומספר וסוג המאיצים (GPU). לא
מגבלות על גודל הנתונים כן. מגבלות הגודל של הנתונים משתנות בהתאם לסוג מערך הנתונים. לא לא לא. עם זאת, יש גודל מקסימלי של תגובת שאילתה של 10GB לקריאות מ-BigQuery. כן. מערכת BigQuery ML אוכפת מכסות מתאימות על בסיס כל פרויקט. מידע נוסף זמין במאמר מכסות ומגבלות.

המאמרים הבאים