Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

היבט AI ו-ML: אופטימיזציה של עלויות

Last reviewed 2025-05-28 UTC

במסמך Well-Architected Framework: AI and ML perspective מופיעה סקירה כללית של עקרונות והמלצות לאופטימיזציה של העלות של מערכות ה-AI לאורך מחזור החיים של ה-ML. אם הארגון שלכם יאמץ גישה פרואקטיבית ומבוססת-מידע לניהול עלויות, הוא יוכל לממש את הפוטנציאל המלא של מערכות AI ו-ML, וגם לשמור על משמעת פיננסית. ההמלצות במסמך הזה תואמות לעקרון הוזלת העלויות של Google Cloud Well-Architected Framework.

מערכות AI ו-ML יכולות לעזור לכם לקבל תובנות חשובות ולנבא נתונים. לדוגמה, תוכלו לצמצם את החיכוך בתהליכים פנימיים, לשפר את חוויית המשתמש ולקבל תובנות מעמיקות יותר לגבי הלקוחות. הענן מציע כמות גדולה של משאבים וזמן קצר להפקת ערך, בלי השקעות גדולות מראש בעומסי עבודה של AI ו-ML. כדי למקסם את הערך העסקי ולתאם את ההוצאות עם היעדים העסקיים, צריך להבין את הגורמים שמשפיעים על העלויות, לייעל את העלויות באופן יזום, להגדיר אמצעי בקרה על ההוצאות ולאמץ שיטות עבודה של FinOps.

ההמלצות במסמך הזה ממופות לעקרונות הליבה הבאים:

הגדרת העלויות וההחזרים ומדידתם

כדי לנהל ביעילות את העלויות של AI ו-ML ב- Google Cloud, צריך להגדיר ולמדוד את העלויות של משאבי הענן ואת הערך העסקי של יוזמות ה-AI וה-ML. כדי לעזור לכם לעקוב אחרי ההוצאות ברמת פירוט גבוהה, Google Cloud מספקת כלים מקיפים לניהול חיובים ועלויות, כמו:

דוחות וטבלאות של חיוב ב-Cloud
לוחות בקרה, תקציבים והתראות ב-Data Studio
Cloud Monitoring
Cloud Logging

כדי לקבל החלטות מושכלות לגבי הקצאת משאבים ואופטימיזציה, כדאי לעיין בהמלצות הבאות.

הגדרת יעדים עסקיים ומדדי KPI

התאמה של הבחירות הטכניות בפרויקטים של AI ו-ML ליעדים עסקיים ולמדדי ביצועים מרכזיים (KPI).

הגדרת יעדים אסטרטגיים ומדדי KPI שמתמקדים בהחזר ROI

חשוב לוודא שפרויקטים של AI ו-ML תואמים ליעדים אסטרטגיים כמו צמיחה בהכנסות, צמצום עלויות, שביעות רצון לקוחות ויעילות. כדאי לשתף את בעלי העניין כדי להבין את סדרי העדיפויות של העסק. להגדיר יעדים ספציפיים, מדידים, ברי השגה, רלוונטיים ותחומי זמן (SMART) ל-AI ול-ML. לדוגמה, מטרה חכמה היא: "לקצר ב-15% את זמן הטיפול בשיחות עם לקוחות בתמיכת לקוחות תוך 6 חודשים באמצעות צ'אט בוט מבוסס-AI".

כדי להתקדם לעבר היעדים העסקיים ולמדוד את ההחזר על ההשקעה (ROI), צריך להגדיר מדדי KPI לקטגוריות הבאות של מדדים:

עלויות של משאבי אימון, היקש, אחסון ורשת, כולל עלויות ספציפיות ליחידה (למשל עלות להיקש, לנקודה על הגרף או למשימה). המדדים האלה עוזרים לכם לקבל תובנות לגבי יעילות והזדמנויות לאופטימיזציה של עלויות. אתם יכולים לעקוב אחרי העלויות האלה באמצעות דוחות חיוב ב-Cloud ולוחות בקרה של Cloud Monitoring.
מדדים של ערך עסקי כמו צמיחה בהכנסות, חיסכון בעלויות, שביעות רצון לקוחות, יעילות, דיוק ואימוץ. אפשר לעקוב אחרי המדדים האלה באמצעות ניתוח נתונים ב-BigQuery ולוחות בקרה ב-Looker.
מדדים ספציפיים לתחום, כמו:
- תחום הקמעונאות: מדידת השיפור בהכנסות והנטישה
- תחום הבריאות: מדידת הזמן של המטופלים והתוצאות שלהם
- ענף הפיננסים: מדידת הפחתת ההונאות
מדדים ספציפיים לפרויקט. אפשר לעקוב אחרי המדדים האלה באמצעות Vertex AI Experiments והערכה.
- ‫AI לחיזוי: מדידת הדיוק והפרטים
- AI גנרטיבי: מדידת ההטמעה, שביעות הרצון ואיכות התוכן
- ‫AI לראייה ממוחשבת: מדידת הדיוק

טיפוח תרבות של מודעות לעלויות ואופטימיזציה מתמשכת

כדאי לאמץ את העקרונות של FinOps כדי לוודא שלכל פרויקט AI ו-ML יש עלויות משוערות ודרכים למדוד ולעקוב אחרי העלויות בפועל לאורך מחזור החיים שלו. חשוב לוודא שלעלויות ולתועלות העסקיות של הפרויקטים שלכם יש בעלים מוגדרים ושהאחריות ברורה.

מידע נוסף זמין במאמר טיפוח תרבות של מודעות לעלויות ב-Cost Optimization pillar של Google Cloud Well-Architected Framework.

שיפור הערך ואופטימיזציה מתמשכת באמצעות איטרציה ומשוב

מיפוי של אפליקציות AI ו-ML ישירות ליעדים העסקיים ומדידת החזר ה-ROI.

כדי לאמת את ההשערות לגבי החזר ה-ROI, כדאי להתחיל עם פרויקטים ניסיוניים ולהשתמש במחזור האופטימיזציה האיטרטיבי הבא:

מעקב רציף וניתוח נתונים: מעקב אחרי מדדי KPI ועלויות כדי לזהות חריגות והזדמנויות לאופטימיזציה.
ביצוע שינויים מבוססי-נתונים: אופטימיזציה של אסטרטגיות, מודלים, תשתית והקצאת משאבים על סמך תובנות מנתונים.
שיפור איטרטיבי: התאימו את היעדים העסקיים ואת מדדי ה-KPI בהתאם למה שלמדתם ולצרכים העסקיים המשתנים. האיטרציה הזו עוזרת לכם לשמור על רלוונטיות ועל התאמה אסטרטגית.
יצירת לולאת משוב: כדאי לבדוק את הביצועים, העלויות והערך עם בעלי העניין כדי לשפר את האופטימיזציה המתמשכת ולתכנן פרויקטים עתידיים.

ניהול נתוני החיוב באמצעות חיוב ב-Cloud ותוויות

כדי לבצע אופטימיזציה יעילה של העלויות, צריך לראות את המקור של כל רכיב עלות. ההמלצות בקטע הזה יעזרו לכם להשתמש בכלים של Google Cloudכדי לקבל תובנות מפורטות לגבי העלויות של AI ו-ML. אפשר גם לשייך עלויות לפרויקטים ספציפיים של AI ו-ML, לצוותים ולפעילויות. התובנות האלה מספקות את הבסיס לאופטימיזציה של העלויות.

ארגון וסימון Google Cloud משאבים

מבנה הפרויקטים והמשאבים בהיררכיה שמשקפת את המבנה הארגוני ואת תהליכי העבודה של AI ו-ML. כדי לעקוב אחרי העלויות ולנתח אותן ברמות שונות, כדאי לארגן את המשאבים באמצעות ארגונים, תיקיות ופרויקטים. Google Cloud מידע נוסף זמין במאמר בנושא הגדרת היררכיית משאבים ל Google Cloud אזור הנחיתה.
כדאי להחיל תוויות משמעותיות על המשאבים. אתם יכולים להשתמש בתוויות שמציינות את הפרויקט, הצוות, הסביבה, שם המודל, מערך הנתונים, תרחיש השימוש ודרישות הביצועים. התוויות מספקות הקשר חשוב לנתוני החיוב ומאפשרות ניתוח מפורט של העלויות.
חשוב לשמור על עקביות במוסכמות התיוג בכל הפרויקטים של AI ו-ML. מוסכמות עקביות למתן תוויות מבטיחות שהנתונים לחיוב יהיו מאורגנים ושאפשר יהיה לנתח אותם בקלות.

שימוש בכלים שקשורים לחיוב

כדי לבצע ניתוח מפורט וליצור דוחות, מייצאים את נתוני החיוב ל-BigQuery. ל-BigQuery יש יכולות שאילתות מתקדמות שמאפשרות לכם לנתח את נתוני החיוב כדי להבין את העלויות.
כדי לצבור עלויות לפי תוויות, פרויקטים או תקופות זמן ספציפיות, אפשר לכתוב שאילתות SQL בהתאמה אישית ב-BigQuery. בעזרת שאילתות כאלה אפשר לשייך עלויות לפעילויות ספציפיות של AI ולמידת מכונה, כמו אימון מודלים, כוונון היפר-פרמטרים או הסקה.
כדי לזהות חריגות בעלויות או עליות חדות לא צפויות בהוצאות, אפשר להשתמש ביכולות הניתוח ב-BigQuery. הגישה הזו יכולה לעזור לכם לזהות בעיות פוטנציאליות או חוסר יעילות בעומסי העבודה של ה-AI וה-ML.
כדי לזהות ולנהל עלויות לא צפויות, אפשר להשתמש במרכז הבקרה לזיהוי אנומליות בחיוב ב-Cloud.
כדי לחלק את העלויות בין צוותים או מחלקות שונים על סמך השימוש במשאבים, אפשר להשתמש בתכונה הקצאת עלויות של Google Cloud. הקצאת עלויות מעודדת אחריות ושקיפות.
כדי לקבל תובנות לגבי דפוסי ההוצאות, כדאי לעיין בדוחות החיוב ב-Cloud שנוצרו מראש. אפשר לסנן ולהתאים אישית את הדוחות האלה כדי להתמקד בפרויקטים או בשירותים ספציפיים של AI ו-ML.

מעקב רציף אחרי משאבים באמצעות לוחות בקרה, התראות ודוחות

כדי ליצור דרך ניתנת להרחבה ועמידה למעקב אחרי עלויות, צריך לבצע מעקב ודיווח באופן רציף. מרכזי בקרה, התראות ודוחות הם הבסיס למעקב יעיל אחרי עלויות. הבסיס הזה מאפשר לכם לשמור על גישה קבועה לפרטי העלויות, לזהות תחומים לאופטימיזציה ולהבטיח התאמה בין היעדים העסקיים לבין העלויות.

יצירת מערכת דיווח

ליצור דוחות מתוזמנים ולשתף אותם עם בעלי העניין המתאימים.

אפשר להשתמש ב-Cloud Monitoring כדי לאסוף מדדים ממקורות שונים, כולל מהאפליקציות, מהתשתית ומ Google Cloud שירותים כמו Compute Engine,‏ Google Kubernetes Engine‏ (GKE) ופונקציות של Cloud Run. כדי להציג מדדים ויומנים בזמן אמת, אפשר להשתמש בלוח הבקרה המובנה של Cloud Monitoring או ליצור לוחות בקרה בהתאמה אישית. לוחות בקרה בהתאמה אישית מאפשרים להגדיר ולהוסיף מדדים למעקב אחרי היבטים ספציפיים של המערכות, כמו ביצועי המודל, קריאות ל-API או מדדי KPI ברמת העסק.

אפשר להשתמש ב-Cloud Logging כדי לרכז את האיסוף והאחסון של יומנים מהאפליקציות, מהמערכות ומשירותי Google Cloud . השימוש ביומנים הוא למטרות הבאות:

מעקב אחרי העלויות והניצול של משאבים כמו מעבד (CPU), זיכרון, אחסון ורשת.
לזהות מקרים של הקצאת יתר (שבהם המשאבים לא מנוצלים במלואם) והקצאת חסר (שבהם אין מספיק משאבים). הקצאת יתר של משאבים מובילה לעלויות מיותרות. הקצאת משאבים נמוכה מדי מאריכה את זמני האימון ועלולה לגרום לבעיות בביצועים.
לזהות משאבים לא פעילים או משאבים שלא מנוצלים מספיק, כמו מכונות וירטואליות ויחידות GPU, ולנקוט פעולות להשבתה שלהם או להתאמת הגודל שלהם כדי לייעל את העלויות.
זיהוי של עליות חדות בעלויות כדי לזהות עליות פתאומיות ובלתי צפויות בשימוש במשאבים או בעלויות.

אפשר להשתמש ב-Looker או ב-Data Studio כדי ליצור מרכזי בקרה ודוחות אינטראקטיביים. קישור מרכזי הבקרה והדוחות למקורות נתונים שונים, כולל BigQuery ו-Cloud Monitoring.

הגדרת ספי התראה על סמך מדדי KPI מרכזיים

לגבי מדדי ה-KPI, קובעים את ערכי הסף שיפעילו התראות. הגדרת ספי התראה משמעותיים יכולה לעזור לכם להימנע מעייפות מהתראות. יוצרים מדיניות התראות ב-Cloud Monitoring כדי לקבל התראות שקשורות למדדי ה-KPI. לדוגמה, אתם יכולים לקבל התראות כשרמת הדיוק יורדת מתחת לסף מסוים או כשההשהיה חורגת ממגבלה מוגדרת. התראות שמבוססות על נתוני יומן יכולות לעדכן אתכם בזמן אמת לגבי בעיות פוטנציאליות בעלויות. ההתראות האלה מאפשרות לכם לנקוט פעולות מתקנות באופן מיידי ולמנוע הפסדים כספיים נוספים.

אופטימיזציה של הקצאת משאבים

כדי להשיג יעילות בעלויות של עומסי עבודה של AI ו-ML ב- Google Cloud, צריך לבצע אופטימיזציה של הקצאת המשאבים. כדי להימנע מהוצאות מיותרות ולוודא שלעומסי העבודה יש את המשאבים שהם צריכים כדי לפעול בצורה אופטימלית, צריך להתאים את הקצאת המשאבים לצרכים של עומסי העבודה.

כדי לייעל את הקצאת משאבי הענן לעומסי עבודה של AI ו-ML, כדאי לפעול לפי ההמלצות הבאות.

שימוש בהתאמה אוטומטית לעומס כדי להתאים באופן דינמי את המשאבים

מומלץ להשתמש בשירותים שתומכים בהתאמה אוטומטית לעומס, שמתאימה באופן אוטומטי את הקצאת המשאבים לביקוש הנוכחי. Google Cloud היתרונות של שינוי גודל אוטומטי:

אופטימיזציה של העלויות והביצועים: אתם נמנעים מתשלום על משאבים לא פעילים. במקביל, שינוי גודל אוטומטי מבטיח שלמערכות שלכם יהיו המשאבים הדרושים כדי לפעול בצורה אופטימלית, גם בעומס שיא.
יעילות משופרת: אתם מאפשרים לצוות להתמקד במשימות אחרות.
גמישות משופרת: אתם יכולים להגיב במהירות לשינויים בביקוש ולשמור על זמינות גבוהה של האפליקציות.

בטבלה הבאה מפורטות הטכניקות שבהן אפשר להשתמש כדי להטמיע התאמה אוטומטית לעומס בשלבים שונים של פרויקטים של AI.

שלב	טכניקות להתאמה אוטומטית לעומס
הדרכה	שימוש בשירותים מנוהלים כמו Vertex AI או GKE, שמציעים יכולות מובנות של התאמה אוטומטית לעומס למשימות אימון. הגדרת מדיניות של התאמה אוטומטית לעומס (automatic scaling) כדי לשנות את מספר המכונות של אימון על סמך מדדים כמו ניצול המעבד (CPU), שימוש בזיכרון ואורך תור העבודות. אפשר להשתמש במדדי קנה מידה מותאמים אישית כדי לכוונן את התנהגות ההרחבה האוטומטית לעומסי העבודה הספציפיים שלכם.
הסקת מסקנות	פריסת המודלים בפלטפורמות שאפשר להרחיב כמו Vertex AI Inference,‏ GPU ב-GKE או TPU ב-GKE. אפשר להשתמש בתכונות של התאמה אוטומטית לעומס כדי לשנות את מספר הרפליקות על סמך מדדים כמו קצב הבקשות, זמן האחזור וניצול המשאבים. כדאי להטמיע איזון עומסים כדי לחלק את התנועה באופן שווה בין העותקים המשוכפלים ולהבטיח זמינות גבוהה.

שלב

טכניקות להתאמה אוטומטית לעומס

הדרכה

שימוש בשירותים מנוהלים כמו Vertex AI או GKE, שמציעים יכולות מובנות של התאמה אוטומטית לעומס למשימות אימון.
הגדרת מדיניות של התאמה אוטומטית לעומס (automatic scaling) כדי לשנות את מספר המכונות של אימון על סמך מדדים כמו ניצול המעבד (CPU), שימוש בזיכרון ואורך תור העבודות.
אפשר להשתמש במדדי קנה מידה מותאמים אישית כדי לכוונן את התנהגות ההרחבה האוטומטית לעומסי העבודה הספציפיים שלכם.

הסקת מסקנות

פריסת המודלים בפלטפורמות שאפשר להרחיב כמו Vertex AI Inference,‏ GPU ב-GKE או TPU ב-GKE.
אפשר להשתמש בתכונות של התאמה אוטומטית לעומס כדי לשנות את מספר הרפליקות על סמך מדדים כמו קצב הבקשות, זמן האחזור וניצול המשאבים.
כדאי להטמיע איזון עומסים כדי לחלק את התנועה באופן שווה בין העותקים המשוכפלים ולהבטיח זמינות גבוהה.

מתחילים עם מודלים ועם מערכי נתונים קטנים

כדי לצמצם עלויות, מומלץ לבדוק השערות של למידת מכונה בקנה מידה קטן כשאפשר, ולהשתמש בגישה איטרטיבית. הגישה הזו, עם מודלים וקבוצות נתונים קטנים יותר, מספקת את היתרונות הבאים:

הפחתת עלויות מההתחלה: שימוש בפחות כוח מחשוב, נפח אחסון וזמן עיבוד יכול להוביל לעלויות נמוכות יותר בשלבים הראשוניים של הניסוי והפיתוח.
איטרציה מהירה יותר: נדרש פחות זמן אימון, כך שאפשר לבצע איטרציה מהירה יותר, לבחון גישות חלופיות ולזהות כיוונים מבטיחים בצורה יעילה יותר.
מורכבות מופחתת: ניפוי באגים, ניתוח ופירוש פשוטים יותר של התוצאות, מה שמוביל למחזורי פיתוח מהירים יותר.
שימוש יעיל במשאבים: סיכוי נמוך יותר להקצאת יתר של משאבים. אתם מקצים רק את המשאבים שדרושים לעומס העבודה הנוכחי.

כדאי לשקול את ההמלצות הבאות:

שימוש בנתוני מדגם קודם: אימון המודלים על קבוצת משנה מייצגת של הנתונים. הגישה הזו מאפשרת להעריך את הביצועים של המודל ולזהות בעיות פוטנציאליות בלי לעבד את כל מערך הנתונים.
עורכים ניסויים באמצעות מחברות: מתחילים עם מקרים קטנים יותר ומשנים את הגודל לפי הצורך. אתם יכולים להשתמש ב-Vertex AI Workbench, סביבת Jupyter notebook מנוהלת שמתאימה מאוד לניסויים עם ארכיטקטורות שונות של מודלים ומערכי נתונים.
מתחילים עם מודלים פשוטים יותר או עם מודלים שאומנו מראש: אפשר להשתמש ב-Vertex AI Model Garden כדי למצוא ולבדוק את המודלים שאומנו מראש. מודלים כאלה דורשים פחות משאבי מחשוב. ככל שהדרישות משתנות, אפשר להגדיל את המורכבות של הקמפיין.
- שימוש במודלים שאומנו מראש למשימות כמו סיווג תמונות ועיבוד שפה טבעית. כדי לחסוך בעלויות האימון, אפשר לבצע התאמה עדינה של המודלים על מערכי נתונים קטנים יותר בהתחלה.
- שימוש ב-BigQuery ML לנתונים מובְנים. בעזרת BigQuery ML אפשר ליצור ולפרוס מודלים ישירות ב-BigQuery. הגישה הזו יכולה להיות חסכונית בשלב הניסוי הראשוני, כי אפשר לנצל את מודל התמחור של BigQuery לפי שאילתה.
התאמה לצורך אופטימיזציה של המשאבים: אפשר להשתמש בתשתית הגמישה של Google Cloudכדי לשנות את גודל המשאבים לפי הצורך. מומלץ להתחיל עם מופעים קטנים יותר ולשנות את הגודל או המספר שלהם כשצריך.

איך מגלים את דרישות המשאבים באמצעות ניסויים

הדרישות למשאבים של עומסי עבודה של AI ו-ML יכולות להשתנות באופן משמעותי. כדי לייעל את הקצאת המשאבים והעלויות, צריך להבין את הצרכים הספציפיים של עומסי העבודה באמצעות ניסויים שיטתיים. כדי לזהות את ההגדרה היעילה ביותר של המודלים, צריך לבדוק הגדרות שונות ולנתח את הביצועים שלהן. לאחר מכן, על סמך הדרישות, צריך להתאים את גודל המשאבים שבהם השתמשתם לאימון ולשירות.

אנחנו ממליצים על הגישה הבאה לניסויים:

מתחילים עם תצורת בסיס: מתחילים עם תצורת בסיס על סמך ההערכות הראשוניות של דרישות עומס העבודה. כדי ליצור בסיס להשוואה, אפשר להשתמש בכלי להערכת עלויות של עומסי עבודה חדשים או בדוח חיוב קיים. מידע נוסף זמין במאמר בנושא העלות האמיתית של AI לארגונים ב- Google Cloud.
הבנת המכסות: לפני שמפעילים ניסויים נרחבים, חשוב להכיר את המכסות של הפרויקט ב- Google Cloud עבור המשאבים וממשקי ה-API שבהם אתם מתכננים להשתמש. המכסות קובעות את טווח ההגדרות שאפשר לבדוק באופן ריאלי. אם תכירו את המכסות, תוכלו לפעול במסגרת מגבלות המשאבים הזמינות במהלך שלב הניסוי.
עורכים ניסויים באופן שיטתי: משנים פרמטרים כמו מספר מעבדי ה-CPU, כמות הזיכרון, מספר מעבדי ה-GPU וה-TPU וסוגם, וקיבולת האחסון. ‫Vertex AI training ו-Vertex AI predictions מאפשרים לכם להתנסות בסוגים שונים של מכונות ובהגדרות שונות.
מעקב אחרי הניצול, העלות והביצועים: אפשר לעקוב אחרי ניצול המשאבים, העלות ומדדי הביצועים המרכזיים כמו זמן האימון, זמן האחזור של ההסקה ודיוק המודל, לכל הגדרה שאתם בודקים.
- כדי לעקוב אחרי ניצול המשאבים ומדדי הביצועים, אפשר להשתמש במסוף Vertex AI.
- כדי לאסוף ולנתח מדדי ביצועים מפורטים, משתמשים ב-Cloud Monitoring.
- כדי לראות את העלויות, אפשר להשתמש בדוחות החיוב ב-Cloud ובלוחות הבקרה של Cloud Monitoring.
- כדי לזהות צווארי בקבוק בביצועים של המודלים ולבצע אופטימיזציה של השימוש במשאבים, אפשר להשתמש בכלי פרופיל כמו Vertex AI TensorBoard.
ניתוח עלויות: השוואה בין העלות והביצועים של כל הגדרה כדי לזהות את האפשרות הכי משתלמת.
הגדרת ספי משאבים ויעדי שיפור על סמך מכסות: הגדרת ספי שבהם ההגדלה מתחילה להניב תשואות פוחתות בביצועים, כמו צמצום מינימלי בזמן ההכשרה או בחביון, בעלות גבוהה משמעותית. כשמגדירים את ערכי הסף האלה, כדאי לקחת בחשבון את מכסות הפרויקט. קובעים את הנקודה שבה העלות וההשלכות הפוטנציאליות על המכסה של הרחבת הפריסה כבר לא מוצדקות על ידי שיפורים בביצועים.
שיפור איטרטיבי: חוזרים על תהליך הניסוי עם הגדרות משופרות על סמך הממצאים. חשוב לוודא תמיד שהשימוש במשאבים נשאר במסגרת המכסות שהוקצו ובהתאם לספי עלות-תועלת שנקבעו.

שימוש ב-MLOps כדי לצמצם חוסר יעילות

ככל שארגונים משתמשים יותר ויותר ב-ML כדי לקדם חדשנות ויעילות, ניהול יעיל של מחזור החיים של ה-ML הופך להיות קריטי. פעולות למידת מכונה (MLOps) הן קבוצה של שיטות שמאפשרות להפוך את מחזור החיים של למידת המכונה לאוטומטי ולייעל אותו, החל מפיתוח המודל ועד לפריסה ולמעקב.

התאמה בין MLOps לבין הגורמים לשינוי בעלויות

כדי ליהנות מ-MLOps לחיסכון בעלויות, צריך לזהות את הגורמים העיקריים לעלויות במחזור החיים של למידת המכונה. לאחר מכן, תוכלו לאמץ וליישם שיטות עבודה מומלצות של MLOps שמתאימות לגורמים שמשפיעים על העלויות. כדאי לתת עדיפות לתכונות MLOps שמתייחסות לגורמי העלות המשפיעים ביותר, ולהטמיע אותן. הגישה הזו עוזרת להבטיח דרך ניהולית ומוצלחת לחיסכון משמעותי בעלויות.

הטמעה של MLOps לאופטימיזציה של עלויות

אלה שיטות נפוצות של MLOps שעוזרות להקטין את העלויות:

ניהול גרסאות: כלים כמו Git יכולים לעזור לכם לעקוב אחרי גרסאות של קוד, נתונים ומודלים. בקרת גרסאות מבטיחה יכולת שחזור, מאפשרת שיתוף פעולה ומונעת עבודה מחדש יקרה שיכולה להיגרם מבעיות בגרסאות.
אינטגרציה רציפה (CI) ופיתוח רציף (CD):‏ Cloud Build ו-Artifact Registry מאפשרים להטמיע צינורות עיבוד נתונים של CI/CD כדי לבצע אוטומציה של בנייה, בדיקה ופריסה של מודלים ללמידת מכונה. צינורות CI/CD מבטיחים ניצול יעיל של המשאבים ומצמצמים את העלויות שקשורות להתערבויות ידניות.
ניראות (observability): בעזרת Cloud Monitoring ו-Cloud Logging אפשר לעקוב אחרי ביצועי המודל בסביבת הייצור, לזהות בעיות ולהפעיל התראות להתערבות יזומה. היכולת לראות את מצב המערכת מאפשרת לכם לשמור על דיוק המודל, לבצע אופטימיזציה של הקצאת המשאבים ולמנוע השבתה יקרה או ירידה בביצועים.
אימון מחדש של מודלים: Vertex AI Pipelines מפשט את התהליכים של אימון מחדש של מודלים באופן תקופתי או כשביצועי המודל יורדים. כשמשתמשים ב-Vertex AI Pipelines לאימון מחדש, המערכת עוזרת לוודא שהמודלים מדויקים ויעילים, וכך אפשר למנוע צריכת משאבים מיותרת ולשמור על ביצועים אופטימליים.
בדיקה והערכה אוטומטיות: ‫Vertex AI עוזר לכם להאיץ את ההערכה של המודלים ולבצע אותה באופן סטנדרטי. כדאי להטמיע בדיקות אוטומטיות לאורך מחזור החיים של למידת המכונה כדי להבטיח את האיכות והאמינות של המודלים. בדיקות כאלה יכולות לעזור לכם לזהות שגיאות בשלב מוקדם, למנוע בעיות יקרות בייצור ולצמצם את הצורך בבדיקות ידניות מקיפות.

מידע נוסף זמין במאמר בנושא MLOps: צינורות עיבוד נתונים של פיתוח רציף ואוטומציה בלמידת מכונה.

אכיפה של שיטות לניהול נתונים ולפיקוח עליהם

ניהול נתונים יעיל ושיטות פיקוח על הנתונים הם קריטיים לאופטימיזציה של העלויות. נתונים מאורגנים היטב יכולים לעודד צוותים לעשות שימוש חוזר במערכי נתונים, להימנע משכפול מיותר ולצמצם את המאמץ שנדרש כדי להשיג נתונים באיכות גבוהה. ניהול פרואקטיבי של הנתונים יכול להפחית את עלויות האחסון, לשפר את איכות הנתונים ולהבטיח שהמודלים של ה-ML יאומנו על הנתונים הרלוונטיים והחשובים ביותר.

כדי ליישם שיטות לניהול נתונים ולשמירה על איכותם, כדאי לפעול לפי ההמלצות הבאות.

הקמה ואימוץ של מסגרת למשילות מידע (data governance)

החשיבות של AI ולמידת מכונה (ML) הולכת וגדלה, ולכן נתונים הם הנכס הכי חשוב לארגונים שעוברים טרנספורמציה דיגיטלית. מסגרת חזקה לניהול נתונים היא דרישה חיונית לניהול עומסי עבודה של AI ו-ML בצורה חסכונית ובקנה מידה גדול. מסגרת לניהול נתונים עם מדיניות, נהלים ותפקידים מוגדרים בבירור מספקת גישה מובנית לניהול נתונים לאורך מחזור החיים שלהם. מסגרת כזו עוזרת לשפר את איכות הנתונים, לשפר את האבטחה, לשפר את הניצול ולצמצם את הכפילות.

יצירת מסגרת למשילות מידע (data governance)

קיימות מסגרות רבות לניהול נתונים, כמו המסגרות שפורסמו על ידי EDM Council, עם אפשרויות שזמינות לתעשיות שונות ולארגונים בגדלים שונים. בוחרים מסגרת שמתאימה לצרכים ולסדרי העדיפויות הספציפיים שלכם ומבצעים בה התאמות.

הטמעה של מסגרת משילות מידע (data governance)

‫Google Cloud מספקת את השירותים והכלים הבאים כדי לעזור לכם להטמיע מסגרת חזקה לניהול נתונים:

Knowledge Catalog הוא מארג נתונים חכם שעוזר לאחד נתונים מבוזרים ולאוטומט את משילות המידע בלי לאחד קבוצות נתונים במקום אחד. כך אפשר להפחית את העלויות של הפצת נתונים ותחזוקה שלהם, לאפשר גילוי נתונים ולקדם שימוש חוזר.
- כדי לארגן את הנתונים, משתמשים בהפשטות של Knowledge Catalog ומגדירים אגמי נתונים ואזורים לוגיים.
- כדי לנהל את הגישה לאגמי נתונים ולאזורים, משתמשים בקבוצות Google ובתפקידים ב-Knowledge Catalog.
- כדי לייעל את התהליכים שקשורים לאיכות הנתונים, מפעילים את התכונה איכות נתונים אוטומטית.
‫Knowledge Catalog הוא גם שירות מנוהל לניהול מטא-נתונים שאפשר להתאים לעומס. הקטלוג מספק בסיס שמבטיח שנכסי הנתונים יהיו נגישים וניתנים לשימוש חוזר.
- מטא-נתונים ממקורות נתמכים Google Cloud מוזנים אוטומטית לקטלוג האוניברסלי. למקורות נתונים מחוץ ל- Google Cloud, צריך ליצור רשומות בהתאמה אישית.
- כדי לשפר את החשיפה של נכסי נתונים ואת הניהול שלהם, אפשר להוסיף מטא-נתונים עסקיים למטא-נתונים טכניים באמצעות היבטים.
- מוודאים שלמדעני נתונים ולמומחי למידת מכונה יש הרשאות מספיקות כדי לגשת ל-Knowledge Catalog ולהשתמש בפונקציית החיפוש.
שיתוף ב-BigQuery מאפשר לכם להחליף נכסי נתונים ביעילות ובאופן מאובטח בין הארגונים שלכם, כדי להתמודד עם אתגרים שקשורים למהימנות הנתונים ולעלויות.
- מגדירים החלפות נתונים ומוודאים שאפשר לראות נכסי נתונים שנאספו ככרטיסי מוצר.
- אפשר להשתמש בחדרים נקיים לנתונים כדי לנהל באופן מאובטח את הגישה למידע אישי רגיש ולשתף פעולה ביעילות עם צוותים וארגונים חיצוניים בפרויקטים של AI ו-ML.
- מוודאים שלמדעני נתונים ולמומחים ללמידת מכונה יש הרשאות מספיקות כדי לראות ולפרסם מערכי נתונים ב-BigQuery sharing.

שימוש חוזר במערכי נתונים ובתכונות לאורך מחזור החיים של למידת מכונה

כדי ליהנות מיתרונות משמעותיים של יעילות וחיסכון בעלויות, מומלץ לעשות שימוש חוזר במערכי נתונים ובתכונות בכמה פרויקטים של למידת מכונה. כשנמנעים ממאמצים מיותרים של הנדסת נתונים ופיתוח תכונות, הארגון יכול להאיץ את פיתוח המודלים, להפחית את עלויות התשתית ולפנות משאבים יקרים לביצוע משימות קריטיות אחרות.

‫Google Cloud מספק את השירותים והכלים הבאים שיעזרו לכם לעשות שימוש חוזר במערכי נתונים ובתכונות:

מומחים בתחום הנתונים ולמידת מכונה יכולים לפרסם מוצרי נתונים כדי למקסם את השימוש החוזר בנתונים בצוותים שונים. אחרי זה אפשר לגלות את מוצרי הנתונים ולהשתמש בהם באמצעות Knowledge Catalog ושיתוף ב-BigQuery.
למערכי נתונים טבלאיים ומובְנים, אפשר להשתמש ב-Vertex AI Feature Store כדי לקדם שימוש חוזר ולייעל את ניהול התכונות באמצעות BigQuery.
אפשר לאחסן נתונים לא מובנים ב-Cloud Storage ולנהל את הנתונים באמצעות טבלאות אובייקטים של BigQuery וכתובות URL חתומות.
אפשר לנהל הטבעות וקטוריות על ידי הוספת מטא-נתונים לאינדקסים של חיפוש וקטורי.

אוטומציה וייעול באמצעות MLOps

היתרון העיקרי של אימוץ שיטות MLOps הוא הפחתה בעלויות של טכנולוגיה וכוח אדם. אוטומציה עוזרת לכם להימנע משכפול של פעילויות למידת מכונה (ML) ומפחיתה את עומס העבודה של מדעני נתונים ומהנדסי ML.

כדי להפוך את פיתוח למידת המכונה לאוטומטי ולייעל אותו באמצעות MLOps, כדאי לפעול לפי ההמלצות הבאות.

אוטומציה וסטנדרטיזציה של איסוף ועיבוד נתונים

כדי לצמצם את המאמץ והזמן שנדרשים לפיתוח של ML, כדאי להפוך לאוטומטיים את הטכנולוגיות של איסוף ועיבוד הנתונים, וליצור להן סטנדרטיזציה.

אוטומציה של איסוף ועיבוד נתונים

בקטע הזה מופיע סיכום של המוצרים, הכלים והשיטות שבהם אפשר להשתמש כדי לאסוף נתונים ולעבד אותם באופן אוטומטי.

מזהים ובוחרים את מקורות הנתונים הרלוונטיים למשימות ה-AI וה-ML:

אפשרויות למסדי נתונים כמו Cloud SQL,‏ Spanner,‏ AlloyDB ל-PostgreSQL,‏ Firestore ו-BigQuery. הבחירה שלכם תלויה בדרישות שלכם, כמו זמן האחזור של גישת הכתיבה (סטטי או דינמי), נפח הנתונים (גבוה או נמוך) ופורמט הנתונים (מובנה, לא מובנה או חצי מובנה). מידע נוסף זמין במאמר בנושא מסדי נתונים שלGoogle Cloud .
אגמי נתונים כמו Cloud Storage עם BigLake.
‫Knowledge Catalog לניהול נתונים במקורות שונים.
פלטפורמות של אירועים בסטרימינג, כמו Pub/Sub,‏ Dataflow או Apache Kafka.
ממשקי API חיצוניים.

לכל אחד ממקורות הנתונים, בוחרים כלי להעברה:

‫Dataflow: לעיבוד נתונים באצווה ובעיבוד זרמי נתונים (stream processing) ממקורות שונים, עם שילוב של רכיבי ML. בארכיטקטורה מבוססת-אירועים, אפשר לשלב את Dataflow עם Eventarc כדי לעבד נתונים בצורה יעילה לצורך למידת מכונה. כדי לשפר את היעילות של MLOps ועבודות ML, כדאי להשתמש ב-GPU וביכולות התאמה.
‫Cloud Run functions: לצורך הטמעה של נתונים מבוססת-אירועים שמופעלת על ידי שינויים במקורות נתונים עבור אפליקציות בזמן אמת.
‫BigQuery: להטמעת נתונים טבלאיים קלאסיים עם גישה תכופה.

בחירת כלים לטרנספורמציה ולטעינה של נתונים:

אפשר להשתמש בכלים כמו Dataflow או Dataform כדי לבצע אוטומציה של טרנספורמציות של נתונים, כמו שינוי קנה מידה של תכונות, קידוד של משתנים קטגוריים ויצירה של תכונות חדשות באצווה, בסטרימינג או בזמן אמת. הכלים שתבחרו תלויים בדרישות שלכם ובשירותים שבחרתם.
אפשר להשתמש ב-Vertex AI Feature Store כדי ליצור ולנהל תכונות באופן אוטומטי. אתם יכולים לרכז תכונות לשימוש חוזר במודלים ובפרויקטים שונים.

איך יוצרים סטנדרטיזציה של איסוף ועיבוד נתונים

כדי לגלות נכסי נתונים, להבין אותם ולנהל אותם, אפשר להשתמש בשירותים לניהול מטא-נתונים כמו Knowledge Catalog. הוא עוזר לכם לתקנן את הגדרות הנתונים ולהבטיח עקביות בכל הארגון.

כדי לאכוף סטנדרטיזציה ולמנוע את העלות של תחזוקת הטמעות מותאמות אישית מרובות, כדאי להשתמש בצינורות אוטומטיים של אימון ותזמור. מידע נוסף מופיע בקטע הבא.

אוטומציה של צינורות עיבוד נתונים לאימון ושימוש חוזר בנכסים קיימים

כדי לשפר את היעילות והפרודוקטיביות ב-MLOps, צינורות עיבוד נתונים אוטומטיים לאימון הם חיוניים. Google Cloud מציעה חבילה חזקה של כלים ושירותים לבנייה ולפריסה של צינורות עיבוד נתונים לאימון, עם דגש חזק על שימוש חוזר בנכסים קיימים. צינורות עיבוד נתונים אוטומטיים לאימון עוזרים להאיץ את פיתוח המודלים, להבטיח עקביות ולצמצם מאמץ מיותר.

אוטומציה של צינורות עיבוד נתונים לאימון

בטבלה הבאה מתוארים השירותים והתכונות של Google Cloud שבהם אפשר להשתמש כדי להפוך לאוטומטיות את הפונקציות השונות של צינור אימון.

תפקיד	Google Cloud שירותים ותכונות
תזמור: הגדרת תהליכי עבודה מורכבים של למידת מכונה שכוללים כמה שלבים ותלויות. אפשר להגדיר כל שלב כמשימה נפרדת בתוך קונטיינר, וכך לנהל ולהרחיב בקלות משימות בודדות.	כדי ליצור פייפליינים ולתזמן אותם, אפשר להשתמש ב-Vertex AI Pipelines או ב-Kubeflow Pipelines. הכלים האלה תומכים בטרנספורמציה פשוטה של נתונים, באימון מודלים, בפריסת מודלים ובניהול גרסאות של צינורות נתונים. הם מאפשרים להגדיר תלויות בין שלבים, לנהל את זרימת הנתונים ולבצע אוטומציה של ההרצה של תהליך העבודה כולו. למשימות תפעוליות מורכבות עם דרישות כבדות של CI/CD ושל חילוץ, טרנספורמציה והעמסה (ETL), מומלץ להשתמש ב-Managed Service for Apache Airflow. אם אתם מעדיפים את Airflow לתזמור נתונים, Managed Service for Apache Airflow הוא שירות מנוהל תואם שמבוסס על Airflow. לצינורות שמוגדרים מחוץ ל-Vertex AI Pipelines, אפשר להשתמש בWorkflows למשימות שמתמקדות בתשתית, כמו הפעלה והפסקה של מכונות וירטואליות או שילוב עם מערכות חיצוניות. כדי להפוך את תהליך ה-CI/CD לאוטומטי, משתמשים ב-Cloud Build עם Pub/Sub. אפשר להגדיר התראות וטריגרים אוטומטיים למקרים שבהם קוד חדש נדחף או כשצריך לאמן מודל חדש. כדי להשתמש בפתרון מנוהל וניתן להרחבה לניהול צינורות, אפשר להשתמש ב-Cloud Data Fusion.
ניהול גרסאות: מעקב ושליטה בגרסאות שונות של צינורות ורכיבים כדי להבטיח שחזור וביקורת.	אחסון תבניות של צינורות עיבוד נתונים של Kubeflow במאגר Kubeflow Pipelines ב-Artifact Registry.
אפשרות לשימוש חוזר: אפשר לעשות שימוש חוזר ברכיבים ובארטיפקטים קיימים של צינורות, כמו מערכי נתונים מוכנים ומודלים מאומנים, כדי להאיץ את הפיתוח.	אפשר לאחסן את תבניות צינורות הנתונים ב-Cloud Storage ולשתף אותן עם כל הארגון.
מעקב: מעקב אחר הפעלת צינור עיבוד הנתונים כדי לזהות ולפתור בעיות.	שימוש ב-Cloud Logging וב-Cloud Monitoring. מידע נוסף מופיע במאמר מעקב רציף אחרי משאבים באמצעות מרכזי בקרה, התראות ודוחות.

הרחבת האפשרות לשימוש חוזר מעבר לצינורות

כדאי לחפש הזדמנויות להרחיב את השימוש החוזר מעבר לצינורות אימון. בהמשך מפורטות דוגמאות ליכולות שמאפשרות לכם לעשות שימוש חוזר בתכונות, במערכי נתונים, במודלים ובקוד של למידת מכונה (ML). Google Cloud

‫Vertex AI Feature Store מספק מאגר מרכזי לארגון, לאחסון ולהצגת תכונות של למידת מכונה. הוא מאפשר לכם לעשות שימוש חוזר בתכונות בפרויקטים ובמודלים שונים, וכך לשפר את העקביות ולצמצם את המאמץ שנדרש להנדסת תכונות. אתם יכולים לאחסן, לשתף ולגשת לתכונות לתרחישי שימוש אונליין ואופליין.
מערכי נתונים של Vertex AI מאפשרים לצוותים ליצור ולנהל מערכי נתונים באופן מרכזי, כך שהארגון יכול למקסם את השימוש החוזר בנתונים ולצמצם את כפילות הנתונים. הצוותים יכולים לחפש את מערכי הנתונים ולגלות אותם באמצעות Knowledge Catalog.
מרשם המודלים של Vertex AI מאפשר לכם לאחסן, לנהל ולפרוס את המודלים שאומנו. מאגר המודלים מאפשר לכם להשתמש מחדש במודלים בצינורות נתונים עוקבים או לחיזוי אונליין, וכך לנצל את מאמצי האימון הקודמים.
קונטיינרים בהתאמה אישית מאפשרים לארוז את קוד ההדרכה ויחסי התלות בקונטיינרים ולאחסן את הקונטיינרים ב-Artifact Registry. קונטיינרים בהתאמה אישית מאפשרים לספק סביבות אימון עקביות וניתנות לשחזור בפרויקטים ובצינורות שונים.

שימוש בשירותי Google Cloud להערכה ולהתאמה של מודלים

Google Cloud מציעה חבילה עוצמתית של כלים ושירותים לייעול ולאוטומציה של הערכה והתאמה של מודלים. הכלים והשירותים האלה יכולים לעזור לכם לקצר את הזמן עד להפקה ולצמצם את המשאבים שנדרשים לאימון ולניטור מתמשכים. השימוש בשירותים האלה מאפשר לצוותי ה-AI וה-ML לשפר את ביצועי המודלים בפחות איטרציות יקרות, להשיג תוצאות מהר יותר ולצמצם את בזבוז משאבי המחשוב.

שימוש בהערכת מודלים ובניסויים יעילים מבחינת משאבים

לפני שמרחיבים את הפתרון, כדאי להתחיל פרויקט AI עם ניסויים. בניסויים, כדאי לעקוב אחרי מטא-נתונים שונים, כמו גרסת מערך הנתונים, פרמטרים של המודל וסוג המודל. כדי לשפר את השחזור וההשוואה של התוצאות, כדאי להשתמש במעקב אחרי מטא-נתונים בנוסף לניהול גרסאות של הקוד, בדומה ליכולות ב-Git. כדי להימנע ממידע חסר או מפריסת גרסה שגויה בסביבת הייצור, כדאי להשתמש ב-Vertex AI Experiments לפני שמטמיעים פריסה מלאה או משימות אימון.

בעזרת Vertex AI Experiments אפשר:

ממשק משתמש ידידותי ו-API מאפשרים לייעל את המעקב אחר מטא-נתונים ואת הגילוי שלהם, ולבצע אוטומציה של התהליכים האלה עבור עומסי עבודה שמוכנים לייצור.
לנתח את מדדי הביצועים של המודל ולהשוות בין מדדים של כמה מודלים.

אחרי שהמודל עובר אימון, צריך לעקוב באופן רציף אחרי הביצועים והסחף של הנתונים לאורך זמן עבור נתונים נכנסים. כדי לייעל את התהליך הזה, אפשר להשתמש ב-Vertex AI Model Monitoring כדי לגשת ישירות למודלים שנוצרו ב-מרשם המודלים. בנוסף, Model Monitoring מאפשרת לבצע אוטומטית מעקב אחרי נתונים ותוצאות באמצעות תחזיות אונליין ובאצווה. אפשר לייצא את התוצאות ל-BigQuery כדי להמשיך לנתח ולעקוב אחרי הנתונים.

בחירת אסטרטגיות אופטימליות לאימון אוטומטי

לכוונון היפרפרמטרים, מומלץ להשתמש בגישות הבאות:

כדי לאתר באופן אוטומטי את ההיפר-פרמטרים האופטימליים למודלים, אפשר להשתמש בכוונון היפר-פרמטרים ב-Vertex AI. ב-Vertex AI נעשה שימוש באלגוריתמים מתקדמים כדי לחקור את מרחב ההיפר-פרמטרים ולזהות את התצורה הטובה ביותר.
כדי לבצע כוונון יעיל של היפר-פרמטרים, מומלץ להשתמש בטכניקות של אופטימיזציה בייסיאנית, במיוחד כשמדובר במודלים מורכבים ובמערכי נתונים גדולים.

לצורך אימון מבוזר, מומלץ להשתמש בגישות הבאות:

למערכי נתונים גדולים ולמודלים מורכבים, כדאי להשתמש בתשתית האימון המבוזרת של Vertex AI. הגישה הזו מאפשרת לאמן את המודלים בכמה מכונות, וכך לקצר משמעותית את זמן האימון ולהפחית את העלויות הנלוות. להשתמש בכלים כמו:
- כוונון ב-Vertex AI לביצוע כוונון מפוקח (SFT) של Gemini,‏ Imagen ומודלים אחרים.
- ‫Vertex AI training או ‫Ray on Vertex AI לאימון מבוזר בהתאמה אישית.
בחרו מסגרות אופטימליות של למידת מכונה, כמו Keras ו-PyTorch, שתומכות בהדרכה מבוזרת ובניצול יעיל של משאבים.

שימוש ב-AI ניתן להסברה

חשוב להבין למה מודל מקבל החלטות מסוימות, ולזהות הטיה פוטנציאלית או תחומים לשיפור. משתמשים ב-Vertex AI ניתן להסברה כדי לקבל תובנות לגבי החיזויים של המודל. Vertex Explainable AI מאפשר ליצור באופן אוטומטי הסברים שמבוססים על תכונות ועל דוגמאות, שמקושרים לניסויים ב-Vertex AI.

מבוסס-תכונות: כדי להבין אילו תכונות משפיעות הכי הרבה על התחזיות של המודל, צריך לנתח את השיוכים של התכונות. ההבנה הזו יכולה לעזור לכם בתהליך של הנדסת תכונות ולשפר את היכולת שלכם להבין את המודל.
מבוסס על דוגמאות: כדי להחזיר רשימה של דוגמאות (בדרך כלל מתוך קבוצת נתונים לאימון) שהכי דומות לקלט, Vertex AI משתמש בחיפוש השכן הקרוב ביותר. מכיוון שקלט דומה בדרך כלל מניב תחזיות דומות, אפשר להשתמש בהסברים האלה כדי לבחון ולהסביר את ההתנהגות של המודל.

שימוש בשירותים מנוהלים ובמודלים שעברו אימון

כדאי לאמץ גישה מצטברת לבחירת מודלים ולפיתוח מודלים. הגישה הזו עוזרת להימנע מעלויות מוגזמות שקשורות להתחלה מחדש בכל פעם. כדי לשלוט בעלויות, מומלץ להשתמש במסגרות למידת מכונה, בשירותים מנוהלים ובמודלים שאומנו מראש.

כדי להפיק את הערך המקסימלי משירותים מנוהלים וממודלים שאומנו מראש, כדאי לפעול לפי ההמלצות הבאות.

שימוש בתיקיות Notebook לניתוח ולניסויים

סביבות Notebook חיוניות לניסויים משתלמים של ML. מחברת מספקת מרחב אינטראקטיבי ושיתופי למדעני נתונים ולמהנדסים לחקור נתונים, לפתח מודלים, לשתף ידע ולבצע איטרציות ביעילות. שיתוף פעולה והעברת ידע באמצעות מחברות מאיצים משמעותית את הפיתוח, את בדיקות הקוד ואת העברת הידע. מחברות עוזרות לייעל את תהליכי העבודה ולצמצם את הכפילות במאמץ.

במקום לרכוש ולנהל חומרה יקרה לסביבת הפיתוח, אתם יכולים להשתמש בתשתית הניתנת להרחבה ולפי דרישה של Vertex AI Workbench ו-Colab Enterprise.

‫Vertex AI Workbench היא סביבת פיתוח של Jupyter notebook לכל תהליך העבודה של מדעי הנתונים. אתם יכולים לקיים אינטראקציה עם Vertex AI ושירותים אחרים Google Cloud מתוך מחברת Jupyter של מופע. השילובים והתכונות של Vertex AI Workbench עוזרים לכם:
- גישה לנתונים ממחברת Jupyter ועיון בהם באמצעות שילובים של BigQuery ו-Cloud Storage.
- אפשר להגדיר עדכונים חוזרים למודל באמצעות הפעלות מתוזמנות של קוד שפועל ב-Vertex AI.
- עיבוד מהיר של נתונים על ידי הפעלת מחברת באשכול Managed Service for Apache Spark.
- להריץ notebook כשלב בצינור עיבוד נתונים באמצעות Vertex AI Pipelines.
‫Colab Enterprise היא סביבת notebook משותפת ומנוהלת עם יכולות האבטחה והתאימות של Google Cloud. ‫Colab Enterprise הוא פתרון אידיאלי אם בין סדרי העדיפויות של הפרויקט שלכם נכללים פיתוח שיתופי וצמצום המאמץ הנדרש לניהול התשתית. ‫Colab Enterprise משתלב עם שירותים ועם עזרה מבוססת-AI שמבוססת על Gemini.Google Cloud ‫Colab Enterprise מאפשר לכם:
- לעבוד במחברות בלי לנהל תשתית.
- שיתוף מחברת עם משתמש יחיד, קבוצת Google או דומיין Google Workspace. אפשר לשלוט בגישה למחברת באמצעות ניהול זהויות וגישה (IAM).
- אינטראקציה עם תכונות שמוטמעות ב-Vertex AI וב-BigQuery.

כדי לעקוב אחרי שינויים ולחזור לגרסאות קודמות כשצריך, אתם יכולים לשלב את מחברות ה-Notebook עם כלי ניהול גרסאות כמו Git.

מתחילים עם מודלים קיימים שעברו אימון מראש

אימון מודלים מורכבים מאפס, במיוחד מודלים של למידה עמוקה, דורש משאבי מחשוב וזמן משמעותיים. כדי לזרז את תהליך הבחירה והפיתוח של המודל, כדאי להתחיל עם מודלים קיימים שעברו אימון מראש. המודלים האלה, שאומנו על מערכי נתונים עצומים, מייתרים את הצורך לאמן מודלים מאפס ומקצרים משמעותית את זמן הפיתוח.

צמצום עלויות ההכשרה והפיתוח

בחירת מודל או API מתאימים לכל משימת ML ושילוב שלהם כדי ליצור תהליך פיתוח ML מקצה לקצה.

‫Vertex AI Model Garden מציע אוסף עצום של מודלים שאומנו מראש למשימות כמו סיווג תמונות, זיהוי אובייקטים ועיבוד שפה טבעית. המודלים מחולקים לקטגוריות הבאות:

מודלים של Google, כמו משפחת המודלים של Gemini ו-Imagen ליצירת תמונות.
מודלים של קוד פתוח כמו Gemma ו-Llama.
מודלים של צד שלישי משותפים כמו Anthropic ו-Mistral AI.

‫Google Cloud מספקת ממשקי API של AI ולמידת מכונה שמאפשרים למפתחים לשלב יכולות AI מתקדמות באפליקציות בלי לבנות מודלים מאפס.

‫Cloud Vision API מאפשר לכם להסיק תובנות מתמונות. ה-API הזה שימושי לאפליקציות כמו ניתוח תמונות, ניהול תוכן והזנת נתונים אוטומטית.
‫Cloud Natural Language API מאפשר לכם לנתח טקסט כדי להבין את המבנה והמשמעות שלו. ה-API הזה שימושי למשימות כמו ניתוח משוב מלקוחות, סיווג תוכן והבנת מגמות ברשתות החברתיות.
‫Speech-to-Text API ממיר אודיו לטקסט. ה-API הזה תומך במגוון רחב של שפות וניבים.
‫Video Intelligence API מנתח תוכן של סרטונים כדי לזהות אובייקטים, סצנות ופעולות. אפשר להשתמש ב-API הזה לניתוח תוכן וידאו, לסינון תוכן ולחיפוש סרטונים.
‫Document AI API מעבד מסמכים כדי לחלץ, לסווג ולהבין נתונים. ה-API הזה עוזר לכם להפוך לאוטומטיים תהליכי עבודה של עיבוד מסמכים.
‫Dialogflow API מאפשר ליצור ממשקים לשיחות, כמו צ'אט בוטים ועוזרים קוליים. אפשר להשתמש ב-API הזה כדי ליצור בוטים לשירות לקוחות ועוזרים וירטואליים.
‫Gemini API ב-Vertex AI מספק גישה למודל ה-AI הכי מתקדם ורב-תכליתי של Google.

צמצום עלויות ההתאמה

כדי לצמצם את הצורך בנתונים נרחבים ובזמן חישוב, כדאי לבצע כוונון עדין של מודלים שאומנו מראש על מערכי נתונים ספציפיים. מומלץ להשתמש בגישות הבאות:

העברת למידה: שימוש בידע ממודל שאומן מראש למשימה חדשה, במקום להתחיל מאפס. הגישה הזו דורשת פחות נתונים וזמן חישוב, וכך עוזרת לצמצם את העלויות.
כוונון מתאמים (כוונון יעיל בפרמטרים): התאמת מודלים למשימות או לדומיינים חדשים בלי לבצע כוונון מלא. הגישה הזו דורשת משאבי מחשוב נמוכים משמעותית ומערך נתונים קטן יותר.
כוונון עדין מפוקח: התאמת התנהגות המודל באמצעות מערך נתונים עם תוויות. הגישה הזו מפשטת את הניהול של התשתית הבסיסית ואת מאמצי הפיתוח שנדרשים לעבודת אימון בהתאמה אישית.

חקירה וניסוי באמצעות Vertex AI Studio

‫Vertex AI Studio מאפשר לכם לבדוק, ליצור אבות טיפוס ולפרוס במהירות אפליקציות של AI גנרטיבי.

אינטגרציה עם Model Garden: מאפשרת גישה מהירה למודלים העדכניים ביותר ולפריסה יעילה של המודלים כדי לחסוך זמן ועלויות.
גישה מאוחדת למודלים ייעודיים: מאפשרת גישה למגוון רחב של מודלים וממשקי API שאומנו מראש, כולל מודלים וממשקי API לשיחה, לטקסט, למדיה, לתרגום ולדיבור. הגישה המאוחדת הזו יכולה לעזור לכם לצמצם את הזמן שאתם משקיעים בחיפוש ובשילוב של שירותים ספציפיים.

שימוש בשירותים מנוהלים לאימון מודלים או להצגתם

שירותים מנוהלים יכולים לעזור לצמצם את העלות של אימון המודלים ולפשט את ניהול התשתית, וכך לאפשר לכם להתמקד בפיתוח ובאופטימיזציה של המודלים. הגישה הזו יכולה להוביל לחיסכון משמעותי בעלויות ולשיפור היעילות.

צמצום התקורה התפעולית

כדי לצמצם את המורכבות והעלות של ניהול התשתית, כדאי להשתמש בשירותים מנוהלים כמו:

‫Vertex AI training מספק סביבה מנוהלת מלאה לאימון המודלים בהתאם לצורך ולגודל. אתם יכולים לבחור מתוך מגוון קונטיינרים מוכנים מראש עם מסגרות ML פופולריות, או להשתמש בקונטיינרים מותאמים אישית משלכם. Google Cloud מטפל בהקצאת משאבים, בהרחבה ובתחזוקה של התשתית, כך שאתם נהנים מתקורה תפעולית נמוכה יותר.
‫Vertex AI predictions מטפל בהתאמת התשתית לגודל, באיזון עומסים ובניתוב בקשות. אתם נהנים מזמינות גבוהה ומביצועים טובים בלי התערבות ידנית.
‫Ray ב-Vertex AI מספק אשכול Ray מנוהל באופן מלא. אתם יכולים להשתמש באשכול כדי להריץ עומסי עבודה מורכבים של AI בהתאמה אישית שמבצעים הרבה חישובים (כוונון היפרפרמטרים, כוונון עדין של מודלים, אימון מודלים מבוזרים ולמידת חיזוק ממשוב אנושי) בלי שתצטרכו לנהל את התשתית שלכם.

שימוש בשירותים מנוהלים כדי לייעל את ניצול המשאבים

פרטים על שימוש יעיל במשאבים זמינים במאמר אופטימיזציה של השימוש במשאבים.

שותפים ביצירת התוכן

מחברים:

אייזק לו | מנהל פיתוח עסקי בתחום ה-AI
Anastasia Prokaeva | Field Solutions Architect, Generative AI
Amy Southwood | Technical Solutions Consultant, Data Analytics & AI

תורמי תוכן אחרים:

‫Filipe Gracio, PhD | Customer Engineer, AI/ML Specialist
קומאר דהנגופאל | מפתח פתרונות חוצי-מוצרים
Marwan Al Shawi | Partner Customer Engineer
ניקולא פינטו (Nicolas Pintaux) | Customer Engineer, Application Modernization Specialist

אמינות

אופטימיזציה של הביצועים

היבט AI ו-ML: אופטימיזציה של עלויות קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.