MLOps on Vertex AI

בקטע הזה מתוארים שירותי Vertex AI שעוזרים לכם להטמיע פעולות למידת מכונה (MLOps) בתהליך העבודה של למידת מכונה (ML).

אחרי שמבצעים פריסה של המודלים, הם צריכים להתעדכן בנתונים משתנים מהסביבה כדי לפעול בצורה אופטימלית ולהישאר רלוונטיים. MLOps הוא אוסף של שיטות עבודה שמשפרות את היציבות והמהימנות של מערכות למידת מכונה.

הכלים של Vertex AI MLOps עוזרים לכם לשתף פעולה בין צוותי AI ולשפר את המודלים שלכם באמצעות מעקב אחר מודלים לחיזוי, התראות, אבחון והסברים שניתן לפעול לפיהם. כל הכלים הם מודולריים, כך שאפשר לשלב אותם במערכות הקיימות לפי הצורך.

מידע נוסף על MLOps זמין במאמרים Continuous delivery and automation pipelines in machine learning ו-Practitioners Guide to MLOps.

תרשים של יכולות MLOps

  • תזמור תהליכי עבודה: אימון ידני של המודלים והצגתם יכולים להיות תהליכים ארוכים שמועדים לשגיאות, במיוחד אם צריך לחזור על התהליכים האלה הרבה פעמים.

    • Vertex AI Pipelines עוזרת לכם לבצע אוטומציה, לעקוב ולשלוט בתהליכי העבודה של למידת מכונה.
  • ניהול והרחבה של משימות אימון: ניהול יעיל של משאבי מחשוב לאימון הוא אתגר מרכזי ב-MLOps, במיוחד כשמבצעים שינוי קנה מידה מניסוי לייצור. כדי לפתור את הבעיה הזו, Vertex AI Training מספק שירותים גמישים שמנוהלים במלואם עם אפשרויות מחשוב שמתאימות לכל מחזור החיים של למידת מכונה.

    • לניסויים ולעומסי עבודה משתנים, הדרכה בהתאמה אישית כוללת את פלטפורמת ברירת המחדל ללא שרת (serverless) שמקצה משאבים לפי דרישה, ומציעה גמישות מקסימלית.

    • עבור עומסי עבודה גדולים וצפויים, אשכולות אימון של Vertex AI באשכולות שמורים מספקים סביבה ייעודית וקבועה שמבטיחה זמינות של משאבים, מספקת ביצועים יציבים ועוזרת לייעל את העלויות לצוותים עם שימוש גבוה.

  • מעקב אחרי המטא-נתונים שמשמשים במערכת ה-ML: במדעי הנתונים, חשוב לעקוב אחרי הפרמטרים, הארטיפקטים והמדדים שמשמשים בתהליך העבודה של ה-ML, במיוחד כשחוזרים על תהליך העבודה כמה פעמים.

    • Vertex ML Metadata מאפשר לכם לשמור את המטא-נתונים, הפרמטרים והארטיפקטים שבהם נעשה שימוש במערכת למידת המכונה (ML). אחרי כן, תוכלו לשלוח שאילתות למטא-נתונים האלה כדי לנתח את הביצועים של מערכת ה-ML או של הארטיפקטים שהיא יוצרת, לנפות באגים ולבדוק את הביצועים.
  • זיהוי המודל הכי טוב לתרחיש שימוש: כשמנסים אלגוריתמים חדשים לאימון, צריך לדעת איזה מודל מאומן מניב את הביצועים הכי טובים.

    • Vertex AI Experiments מאפשר לכם לעקוב אחרי ארכיטקטורות שונות של מודלים, היפר-פרמטרים וסביבות אימון ולנתח אותם, כדי לזהות את המודל הכי טוב לתרחיש השימוש שלכם.

    • Vertex AI TensorBoard עוזר לעקוב אחרי ניסויים בלמידת מכונה, להציג אותם חזותית ולהשוות ביניהם כדי למדוד את הביצועים של המודלים.

  • ניהול גרסאות של מודלים: הוספת מודלים למאגר מרכזי עוזרת לכם לעקוב אחרי גרסאות של מודלים.

    • מרשם המודלים של Vertex AI מספק סקירה כללית של המודלים שלכם, כדי שתוכלו לארגן, לעקוב ולאמן גרסאות חדשות בצורה טובה יותר. ממרשם המודלים, אפשר להעריך מודלים, לפרוס מודלים לנקודת קצה, ליצור היקשים באצווה ולראות פרטים על מודלים ספציפיים וגרסאות של מודלים.
  • ניהול תכונות: כשמשתמשים מחדש בתכונות של למידת מכונה בכמה צוותים, צריך דרך מהירה ויעילה לשתף את התכונות ולהציג אותן.

    • Vertex AI Feature Store מספק מאגר מרכזי לארגון, לאחסון ולהצגה של תכונות של למידת מכונה. שימוש במאגר פיצ'רים מרכזי מאפשר לארגון לעשות שימוש חוזר בתכונות של למידת מכונה בהיקף נרחב, ולהגדיל את קצב הפיתוח והפריסה של אפליקציות חדשות של למידת מכונה.
  • מעקב אחרי איכות המודל: מודל שמוטמע בסביבת ייצור יפעל בצורה הכי טובה על נתוני קלט של הסקה שדומים לנתוני האימון. כשנתוני הקלט שונים מהנתונים ששימשו לאימון המודל, הביצועים של המודל עלולים להידרדר, גם אם המודל עצמו לא השתנה.

    • Vertex AI Model Monitoring עוקב אחרי מודלים כדי לזהות הטיה בין נתוני האימון לנתוני ההסקה וסחף בהסקה, ושולח לכם התראות כשההטיה בנתוני ההסקה הנכנסים חורגת יותר מדי מהבסיס של נתוני האימון. אתם יכולים להשתמש בהתראות ובחלוקת התכונות כדי להעריך אם צריך לאמן מחדש את המודל.
  • התאמת קנה מידה של אפליקציות AI ו-Python: Ray היא מסגרת קוד פתוח להתאמת קנה מידה של אפליקציות AI ו-Python. ‫Ray מספקת את התשתית לביצוע מחשוב מבוזר ועיבוד מקבילי בתהליך העבודה של למידת מכונה (ML).

    • Ray on Vertex AI מיועד לאפשר לכם להשתמש באותו קוד Ray בקוד פתוח כדי לכתוב תוכניות ולפתח אפליקציות ב-Vertex AI עם שינויים מינימליים. לאחר מכן תוכלו להשתמש בשילובים של Vertex AI עם שירותים אחרים Google Cloud כמו Vertex AI Inference ו-BigQuery כחלק מתהליך העבודה של למידת מכונה (ML).

המאמרים הבאים