במסמך הזה, שמופיע בWell-Architected Framework: AI and ML perspective, מפורטים העקרונות וההמלצות לבנייה ולהפעלה של מערכות AI ו-ML חזקות ב- Google Cloud. ההמלצות האלה עוזרות לכם להגדיר רכיבים בסיסיים כמו ניראות (observability), אוטומציה ומדרגיות. ההמלצות במסמך הזה תואמות לעקרון המצוינות התפעולית של Google Cloud Well-Architected Framework.
מצוינות תפעולית בתחום ה-AI ולמידת המכונה היא היכולת לפרוס, לנהל ולפקח בצורה חלקה על מערכות וצינורות של AI ולמידת מכונה שעוזרים להשיג את היעדים האסטרטגיים של הארגון. מצוינות תפעולית מאפשרת לכם להגיב ביעילות לשינויים, לצמצם את המורכבות התפעולית ולוודא שהפעולות שלכם תואמות ליעדים העסקיים.
ההמלצות במסמך הזה ממופות לעקרונות הליבה הבאים:
- בניית בסיס חזק לפיתוח מודלים
- אוטומציה של מחזור החיים של פיתוח המודל
- הטמעה של יכולת תצפית
- בניית תרבות של מצוינות תפעולית
- תכנון להשגת יכולת הרחבה
בניית בסיס חזק לפיתוח מודלים
כדי לפתח ולפרוס מערכות AI אמינות וניתנות להרחבה שיעזרו לכם להשיג את היעדים העסקיים שלכם, חשוב לבנות בסיס חזק לפיתוח מודלים. בסיס כזה מאפשר ליצור תהליכי עבודה עקביים, להפוך שלבים קריטיים לאוטומטיים כדי לצמצם את מספר השגיאות, ולוודא שהמודלים יכולים להתרחב בהתאם לביקוש. בסיס חזק לפיתוח מודלים מבטיח שאפשר יהיה לעדכן, לשפר ולאמן מחדש את מערכות ה-ML בצורה חלקה. התשתית גם עוזרת לכם להתאים את ביצועי המודלים לצרכים העסקיים, להטמיע במהירות פתרונות AI משמעותיים ולהסתגל לדרישות משתנות.
כדי ליצור בסיס חזק לפיתוח מודלים של AI, כדאי לפעול לפי ההמלצות הבאות.
הגדרת הבעיות והתוצאות הנדרשות
לפני שמתחילים פרויקט AI או ML, חשוב להבין בבירור את הבעיות העסקיות שרוצים לפתור ואת התוצאות הרצויות. מתחילים עם תוכנית של היעדים העסקיים ומפרקים את היעדים למדדי ביצועים מרכזיים (KPI) שניתנים למדידה. כדי לארגן ולתעד את הגדרות הבעיה וההשערות בסביבת Jupyter notebook, אפשר להשתמש בכלים כמו Vertex AI Workbench. כדי להטמיע ניהול גרסאות לקוד ולמסמכים ולתעד את הפרויקטים, היעדים וההנחות שלכם, כדאי להשתמש בכלים כמו Git. כדי לפתח ולנהל הנחיות לאפליקציות של AI גנרטיבי, אפשר להשתמש ב-Vertex AI Studio.
איסוף ועיבוד מוקדם של הנתונים הנדרשים
כדי להטמיע עיבוד מראש של נתונים ושינוי שלהם, אפשר להשתמש ב-Dataflow (ל-Apache Beam), ב-Dataproc (ל-Apache Spark) או ב-BigQuery אם תהליך מבוסס-SQL מתאים. כדי לאמת סכימות ולזהות אנומליות, אפשר להשתמש ב-TensorFlow Data Validation (TFDV) וליהנות מסריקות אוטומטיות של איכות הנתונים ב-BigQuery, במקרים הרלוונטיים.
ב-AI גנרטיבי, איכות הנתונים כוללת דיוק, רלוונטיות, מגוון והתאמה למאפייני הפלט הנדרשים. במקרים שבהם נתונים מהעולם האמיתי לא מספיקים או לא מאוזנים, אפשר ליצור נתונים סינתטיים כדי לשפר את החוסן וההכללה של המודל. כדי ליצור מערכי נתונים סינתטיים על סמך דפוסים קיימים, או כדי להגדיל את נתוני האימון לשיפור הביצועים של המודל, אפשר להשתמש ב-BigQuery DataFrames וב-Gemini. נתונים סינתטיים חשובים במיוחד ל-AI גנרטיבי כי הם יכולים לעזור לשפר את מגוון ההנחיות ואת החוסן הכולל של המודל. כשיוצרים מערכי נתונים לצורך כוונון עדין של מודלים של AI גנרטיבי, כדאי להשתמש ביכולות של Vertex AI ליצירת נתונים סינתטיים.
במשימות של AI גנרטיבי כמו כוונון עדין או למידה ממשוב אנושי (RLHF), חשוב לוודא שהתוויות משקפות בצורה מדויקת את האיכות, הרלוונטיות והבטיחות של התוצרים שנוצרו.
בחירת גישה מתאימה ללמידת מכונה
כשמעצבים את המודל ואת הפרמטרים, חשוב לקחת בחשבון את המורכבות של המודל ואת הצרכים החישוביים שלו. בהתאם למשימה (למשל סיווג, רגרסיה או יצירה), כדאי להשתמש באימון בהתאמה אישית ב-Vertex AI לבניית מודלים בהתאמה אישית או ב-AutoML למשימות פשוטות יותר של ML. לשימושים נפוצים, אפשר גם לגשת למודלים שאומנו מראש דרך Vertex AI Model Garden. אתם יכולים להתנסות במגוון מודלים בסיסיים חדשניים למקרים שונים, כמו יצירת טקסט, תמונות וקוד.
יכול להיות שתרצו לבצע התאמה מדויקת של מודל בסיס שאומן מראש כדי להשיג ביצועים אופטימליים בתרחיש השימוש הספציפי שלכם. אם יש לכם דרישות לביצועים גבוהים באימון מותאם אישית, אתם יכולים להגדיר יחידות Tensor Processing Units (TPU) ב-Cloud או משאבי GPU כדי להאיץ את האימון וההסקה של מודלים ללמידה עמוקה, כמו מודלים גדולים של שפה (LLM) ומודלים של דיפוזיה.
הגדרת ניהול גרסאות לקוד, למודלים ולנתונים
כדי לנהל ולפרוס גרסאות קוד בצורה יעילה, כדאי להשתמש בכלים כמו GitHub או GitLab. הכלים האלה מספקים תכונות שיתוף פעולה חזקות, אסטרטגיות של הסתעפות ושילוב עם צינורות CI/CD כדי להבטיח תהליך פיתוח יעיל.
משתמשים בפתרונות מתאימים לניהול כל ארטיפקט במערכת ה-ML, כמו הדוגמאות הבאות:
- לפריטי קוד כמו קובצי אימג' של קונטיינרים ורכיבי צינורות, Artifact Registry מספק פתרון אחסון ניתן להרחבה שיכול לעזור לשפר את האבטחה. ב-Artifact Registry יש גם ניהול גרסאות, ואפשר לשלב אותו עם Cloud Build ועם Cloud Deploy.
- כדי לנהל ארטיפקטים של נתונים, כמו מערכי נתונים שמשמשים לאימון ולהערכה, אפשר להשתמש בפתרונות כמו BigQuery או Cloud Storage לאחסון ולניהול גרסאות.
- כדי לאחסן מטא-נתונים ואינדיקטורים למיקומי נתונים, משתמשים במערכת בקרת הגרסאות או בקטלוג נתונים נפרד.
כדי לשמור על העקביות של נתוני התכונות ולנהל את הגרסאות שלהם, כדאי להשתמש ב-Vertex AI Feature Store. כדי לעקוב אחרי ארטיפקטים של מודלים ולנהל אותם, כולל קבצים בינאריים ומטא-נתונים, אפשר להשתמש ב-מרשם המודלים של Vertex AI, שמאפשר לאחסן, לארגן ולפרוס גרסאות של מודלים בצורה חלקה.
כדי לוודא שהמודל אמין, כדאי להטמיע את Vertex AI Model Monitoring. זיהוי סחף נתונים, מעקב אחר ביצועים וזיהוי חריגות בסביבת הייצור. במערכות AI גנרטיבי, חשוב לעקוב אחרי שינויים באיכות הפלט ובעמידה בדרישות הבטיחות.
אוטומציה של מחזור החיים של פיתוח המודל
אוטומציה עוזרת לייעל כל שלב במחזור החיים של AI ו-ML. אוטומציה מצמצמת את המאמץ הידני ויוצרת תהליכים סטנדרטיים, וכך משפרת את היעילות התפעולית ומפחיתה את הסיכון לשגיאות. תהליכי עבודה אוטומטיים מאפשרים לבצע איטרציות מהר יותר, פריסה עקבית בסביבות שונות ותוצאות אמינות יותר, כך שהמערכות יכולות להתרחב ולהסתגל בצורה חלקה.
כדי לבצע אוטומציה של מחזור החיים של הפיתוח של מערכות AI ו-ML, כדאי להשתמש בהמלצות הבאות.
שימוש במערכת לניהול תזמור צינורות
אתם יכולים להשתמש ב-Vertex AI Pipelines כדי להפוך כל שלב במחזור החיים של למידת מכונה לאוטומטי – מהכנת הנתונים ועד לאימון המודל, להערכה ולפריסה. כדי לזרז את הפריסה ולשמור על עקביות בין הפרויקטים, כדאי להפוך משימות שחוזרות על עצמן לאוטומטיות באמצעות הפעלות מתוזמנות של צינורות, לעקוב אחרי תהליכי עבודה באמצעות מדדי ביצוע ולפתח תבניות של צינורות שאפשר לעשות בהן שימוש חוזר לתהליכי עבודה סטנדרטיים. היכולות האלה כוללות מודלים של AI גנרטיבי, שלעתים קרובות נדרשים להם שלבים מיוחדים כמו הנדסת הנחיות, סינון תשובות וhuman-in-the-loop הערכה. ב-AI גנרטיבי, Vertex AI Pipelines יכולה לבצע אוטומציה של השלבים האלה, כולל הערכה של התוצרים שנוצרו בהשוואה למדדי איכות ולהנחיות בטיחות. כדי לשפר את מגוון ההנחיות ואת חוסן המודל, תהליכי עבודה אוטומטיים יכולים לכלול גם טכניקות של הגדלת נתונים.
הטמעה של צינורות עיבוד נתונים של CI/CD
כדי לבצע אוטומציה של פיתוח, בדיקה ופריסה של מודלים של למידת מכונה, משתמשים ב-Cloud Build. השירות הזה יעיל במיוחד כשמריצים חבילות של בדיקות לקוד של אפליקציה, כדי לוודא שהתשתית, התלות והאריזה של המודל עומדים בדרישות הפריסה.
מערכות ML לרוב מצריכות שלבים נוספים מעבר לבדיקת הקוד. לדוגמה, צריך לבצע בדיקת עומס של המודלים בעומסים משתנים, לבצע הערכות בכמות גדולה כדי להעריך את ביצועי המודל במערכי נתונים מגוונים, ולאמת את תקינות הנתונים לפני אימון מחדש. כדי לדמות עומסי עבודה ריאליים לבדיקות מאמץ, אפשר להשתמש בכלים כמו Locust, Grafana k6 או Apache JMeter. כדי לזהות צווארי בקבוק, כדאי לעקוב אחרי מדדים מרכזיים כמו זמן אחזור, שיעור שגיאות וניצול משאבים באמצעות Cloud Monitoring. במקרה של AI גנרטיבי, הבדיקות צריכות לכלול גם הערכות שספציפיות לסוג התוכן שנוצר, כמו איכות הטקסט, נאמנות התמונה או פונקציונליות הקוד. ההערכות האלה יכולות לכלול מדדים אוטומטיים כמו פרפלקסיטי (מידת ההסתברות של רצף מילים) למודלים של שפה, או הערכה שכוללת את האדם שבתהליך כדי לבדוק היבטים מורכבים יותר כמו יצירתיות ובטיחות.
כדי להטמיע משימות של בדיקה והערכה, אפשר לשלב את Cloud Build עם שירותים אחרים Google Cloud . לדוגמה, אפשר להשתמש ב-Vertex AI Pipelines להערכת מודלים אוטומטית, ב-BigQuery לניתוח נתונים בקנה מידה גדול ובאימות של צינורות Dataflow לאימות תכונות.
כדי לשפר עוד יותר את צינור ה-CI/CD, אפשר להשתמש ב-Vertex AI לאימון רציף כדי להפעיל אימון מחדש אוטומטי של מודלים על נתונים חדשים. במקרה של AI גנרטיבי, כדי שהפלט שנוצר יהיה רלוונטי ומגוון, יכול להיות שהאימון מחדש יכלול עדכון אוטומטי של המודלים באמצעות נתוני אימון או הנחיות חדשים. אתם יכולים להשתמש ב-Vertex AI Model Garden כדי לבחור את מודלי הבסיס העדכניים ביותר שזמינים לכוונון. השיטה הזו מבטיחה שהמודלים יישארו עדכניים ומותאמים לצרכים העסקיים המשתנים שלכם.
הטמעה של גרסאות מודל בטוחות ומבוקרות
כדי לצמצם את הסיכונים ולהבטיח פריסות אמינות, כדאי ליישם גישה לשחרור מודלים שמאפשרת לזהות בעיות בשלב מוקדם, לאמת את הביצועים ולבטל את הפריסה במהירות כשנדרש.
כדי לארוז את המודלים והאפליקציות של ה-ML בקובצי אימג' של קונטיינרים ולפרוס אותם, משתמשים ב-Cloud Deploy. אפשר לפרוס את המודלים בנקודות קצה של Vertex AI.
כדי להטמיע גרסאות מבוקרות של אפליקציות ומערכות מבוססות-AI, אפשר להשתמש באסטרטגיות כמו הפצת גרסת קנרי. באפליקציות שמשתמשות במודלים מנוהלים כמו Gemini, מומלץ להשיק גרסאות חדשות של האפליקציה בהדרגה לקבוצת משנה של משתמשים לפני הפריסה המלאה. הגישה הזו מאפשרת לכם לזהות בעיות פוטנציאליות בשלב מוקדם, במיוחד כשאתם משתמשים במודלים של AI גנרטיבי שבהם הפלט יכול להשתנות.
כדי להפיץ מודלים שעברו התאמה אישית, אפשר להשתמש ב-Cloud Deploy כדי לנהל את הפריסה של גרסאות המודל, ולהשתמש באסטרטגיית גרסה איטרטיבית לקהל מצומצם (canary release) כדי למזער את הסיכון. במודלים מנוהלים ובמודלים שעברו כוונון עדין, המטרה של השקות מבוקרות היא לבדוק שינויים בקרב קהל מוגבל לפני שמשחררים את האפליקציות והמודלים לכל המשתמשים.
כדי לבצע אימות מהימן, כדאי להשתמש ב-Vertex AI Experiments כדי להשוות בין מודלים חדשים למודלים קיימים, וב-Vertex AI model evaluation כדי להעריך את ביצועי המודל. במקרה של AI גנרטיבי, צריך להגדיר מדדי הערכה שתואמים לתרחיש השימוש המיועד ולסיכונים הפוטנציאליים. אתם יכולים להשתמש בשירות להערכת AI גנרטיבי ב-Vertex AI כדי להעריך מדדים כמו רעילות, קוהרנטיות, דיוק עובדתי ועמידה בהנחיות בטיחות.
כדי להבטיח פריסה אמינה, צריך תוכנית חזרה חזקה. במערכות מסורתיות של למידת מכונה, אפשר להשתמש בVertex AI Model Monitoring כדי לזהות סחף נתונים וירידה בביצועים. במודלים של AI גנרטיבי, אפשר לעקוב אחרי מדדים רלוונטיים ולהגדיר התראות על שינויים באיכות הפלט או על הופעה של תוכן פוגעני באמצעות הערכת מודלים ב-Vertex AI, בשילוב עם Cloud Logging ו-Cloud Monitoring. הגדרת התראות על סמך מדדים ספציפיים ל-AI גנרטיבי, כדי להפעיל הליכי חזרה למצב הקודם כשצריך. כדי לעקוב אחרי שושלת המודלים ולחזור לגרסה היציבה האחרונה, אפשר להשתמש בתובנות ממרשם המודלים של Vertex AI.
הטמעה של ניראות
ההתנהגות של מערכות AI ו-ML יכולה להשתנות עם הזמן בגלל שינויים בנתונים או בסביבה ועדכונים במודלים. האופי הדינמי הזה הופך את יכולת התצפית לחיונית כדי לזהות בעיות בביצועים, הטיות או התנהגות לא צפויה. זה נכון במיוחד לגבי מודלים של AI גנרטיבי, כי הפלט שלהם יכול להיות מאוד מגוון וסובייקטיבי. ניראות מאפשרת לכם לטפל באופן יזום בהתנהגות לא צפויה ולוודא שמערכות ה-AI וה-ML שלכם יישארו אמינות, מדויקות והוגנות.
כדי להטמיע יכולות אבחון במערכות AI ו-ML, כדאי לפעול לפי ההמלצות הבאות.
מעקב רציף אחרי הביצועים
שימוש במדדים ובקריטריונים להצלחה לצורך הערכה שוטפת של מודלים אחרי הפריסה.
אתם יכולים להשתמש בVertex AI Model Monitoring כדי לעקוב באופן יזום אחרי ביצועי המודל, לזהות הטיה בין אימון למילוי בקשות וסחף בחיזוי, ולקבל התראות שיפעילו אימון מחדש של המודל או פעולות אחרות שנדרשות. כדי לעקוב ביעילות אחרי training-serving skew, צריך ליצור מערך נתונים מוזהב שמייצג את חלוקת הנתונים האידיאלית, ולהשתמש ב-TFDV כדי לנתח את נתוני האימון וליצור סכימה של בסיס.
מגדירים את התכונה 'מעקב אחרי מודלים' כדי להשוות את ההתפלגות של נתוני הקלט עם מערך הזהב לזיהוי אוטומטי של הטיה. במקרה של מודלים מסורתיים של למידת מכונה, כדאי להתמקד במדדים כמו דיוק, רמת דיוק, היזכרות, ציון F1, AUC-ROC ואובדן לוגריתמי. הגדרת ספי התראות מותאמות אישית ב-Model Monitoring. ל-AI גנרטיבי, אפשר להשתמש בשירות ההערכה של AI גנרטיבי כדי לעקוב באופן רציף אחרי פלט המודל בסביבת הייצור. אפשר גם להפעיל מדדי הערכה אוטומטיים לאיכות התגובה, לבטיחות, להקפדה על ההוראות, לביסוס, לסגנון הכתיבה ולמלל. כדי להעריך את הפלט שנוצר מבחינת איכות, רלוונטיות, בטיחות ועמידה בהנחיות, אפשר לשלב הערכה של human-in-the-loop.
יצירת לולאות משוב לאימון מחדש אוטומטי של מודלים באמצעות Vertex AI Pipelines כש-Model Monitoring מפעיל התראה. התובנות האלה יעזרו לכם לשפר את המודלים באופן מתמשך.
הערכת מודלים במהלך הפיתוח
לפני שפורסים מודלים של LLM ומודלים אחרים של AI גנרטיבי, חשוב לבצע הערכה יסודית שלהם בשלב הפיתוח. כדי להשיג ביצועים אופטימליים ולצמצם את הסיכון, כדאי להשתמש בהערכת מודלים של Vertex AI. אפשר להשתמש בהערכה מהירה ב-Vertex AI כדי לאפשר ל- Google Cloud להריץ הערכות באופן אוטומטי על סמך מערך הנתונים וההנחיות שאתם מספקים.
אתם יכולים גם להגדיר ולשלב מדדים מותאמים אישית שספציפיים לתרחיש השימוש שלכם. כדי לקבל משוב על תוכן שנוצר, אפשר לשלב תהליכי עבודה של האדם שבתהליך באמצעות Vertex AI Model Evaluation.
להשתמש בבדיקות יריבות כדי לזהות נקודות חולשה ומצבי כשל פוטנציאליים. כדי לזהות הטיות פוטנציאליות ולצמצם אותן, אפשר להשתמש בשיטות כמו ניתוח של תת-קבוצות ויצירת תרחישים היפותטיים. אפשר להשתמש בתובנות שנאספו מההערכות שהושלמו במהלך שלב הפיתוח כדי להגדיר את אסטרטגיית המעקב אחר המודל בסביבת הייצור. כדאי להכין את הפתרון למעקב מתמשך כמו שמתואר בקטע מעקב שוטף אחר הביצועים במסמך הזה.
מעקב אחר הזמינות
כדי לקבל תובנות לגבי התקינות והביצועים של נקודות הקצה והתשתית שפרסתם, תוכלו להשתמש ב-Cloud Monitoring. עבור נקודות הקצה של Vertex AI, כדאי לעקוב אחרי מדדים מרכזיים כמו קצב הבקשות, שיעור השגיאות, זמן האחזור וניצול המשאבים, ולהגדיר התראות על אנומליות. מידע נוסף זמין במאמר בנושא מדדים של Cloud Monitoring ל-Vertex AI.
מעקב אחר תקינות התשתית הבסיסית, שיכולה לכלול מכונות וירטואליות ב-Compute Engine, אשכולות Google Kubernetes Engine (GKE) ומעבדי TPU ו-GPU. קבלת המלצות אוטומטיות לאופטימיזציה מ-Active Assist. אם אתם משתמשים בהתאמה אוטומטית לעומס, כדאי לעקוב אחרי התנהגות ההתאמה כדי לוודא שהיא מגיבה בצורה מתאימה לשינויים בדפוסי התנועה.
כדי לעקוב אחרי הסטטוס של פריסות מודלים, כולל השקות קנרית והחזרות לגרסה קודמת, אפשר לשלב את Cloud Deploy עם Cloud Monitoring. בנוסף, אפשר לעקוב אחרי איומי אבטחה ונקודות חולשה פוטנציאליים באמצעות Security Command Center.
הגדרת התראות בהתאמה אישית לגבי ספים ספציפיים לעסק
כדי לזהות ולתקן חריגות ובעיות בזמן, כדאי להגדיר התראות בהתאמה אישית על סמך ספים שספציפיים ליעדים העסקיים שלכם. דוגמאות ל Google Cloud מוצרים שבהם אפשר להשתמש כדי להטמיע מערכת התראות בהתאמה אישית:
- Cloud Logging: איסוף, אחסון וניתוח של יומנים מכל הרכיבים של מערכת ה-AI ו-ML.
- Cloud Monitoring: יצירת לוחות בקרה מותאמים אישית להצגה חזותית של מדדים ומגמות מרכזיים, והגדרת מדדים מותאמים אישית לפי הצרכים שלכם. אתם יכולים להגדיר התראות כדי לקבל עדכונים על בעיות קריטיות, ולשלב את ההתראות עם כלי ניהול האירועים שלכם, כמו PagerDuty או Slack.
- Error Reporting: שגיאות וחריגים נלכדים ומנותחים באופן אוטומטי.
- Cloud Trace: ניתוח הביצועים של מערכות מבוזרות וזיהוי צווארי בקבוק. המעקב שימושי במיוחד להבנת זמן האחזור בין רכיבים שונים של צינור הנתונים של ה-AI וה-ML.
- Cloud Profiler: ניתוח רציף של ביצועי הקוד בסביבת ייצור וזיהוי צווארי בקבוק בביצועים בשימוש במעבד או בשימוש בזיכרון.
יצירת תרבות של מצוינות תפעולית
המעבר מהתמקדות רק בבניית מודלים להתמקדות בבניית פתרונות AI ברי קיימא, מהימנים ומשמעותיים. הצוותים יכולים ללמוד, לחדש ולשפר את עצמם באופן רציף, וכך לקצר את מחזורי הפיתוח, לצמצם את השגיאות ולשפר את היעילות. אם תתנו עדיפות לאוטומציה, לסטנדרטיזציה ולשיקולים אתיים, תוכלו להבטיח שהיוזמות שלכם בתחום ה-AI וה-ML יניבו ערך באופן עקבי, יפחיתו סיכונים ויקדמו אתיקה של בינה מלאכותית.
כדי ליצור תרבות של מצוינות תפעולית במערכות ה-AI וה-ML, כדאי ליישם את ההמלצות הבאות.
קידום אוטומציה וסטנדרטיזציה
כדי להדגיש את היעילות והעקביות, כדאי להטמיע אוטומציה ושיטות עבודה סטנדרטיות בכל שלב במחזור החיים של ה-AI ולמידת המכונה. האוטומציה מפחיתה שגיאות ידניות ומאפשרת לצוותים להתמקד בחדשנות. התקנון מבטיח שאפשר לחזור על התהליכים ולהרחיב אותם בצוותים ובפרויקטים.
לתת עדיפות ללמידה ולשיפור מתמשכים
ליצור סביבה שבה למידה מתמשכת וניסויים הם עקרונות מרכזיים. כדאי לעודד את הצוותים להתעדכן בהתפתחויות בתחום ה-AI וה-ML, ולספק הזדמנויות ללמוד מפרויקטים קודמים. תרבות של סקרנות והסתגלות מובילה לחדשנות ומבטיחה שהצוותים יהיו מוכנים להתמודד עם אתגרים חדשים.
טיפוח תחושת אחריות ובעלות
כדי לבנות אמון והתאמה, צריך להגדיר בבירור את התפקידים, תחומי האחריות ומדדי ההצלחה. מאפשרים לצוותים לקבל החלטות מושכלות במסגרת הגבולות האלה, ומגדירים דרכים שקופות למדידת ההתקדמות. תחושת בעלות מניעה את הצוותים ומבטיחה אחריות משותפת לתוצאות.
הטמעת שיקולים אתיים ובטיחותיים לגבי AI
חשוב לתת עדיפות לשיקולים אתיים בכל שלב בפיתוח. חשוב לעודד את הצוותים לחשוב בצורה ביקורתית על ההשפעה של פתרונות ה-AI שלהם, ולעורר דיונים על הוגנות, הטיה והשפעה חברתית. עקרונות ברורים ומנגנוני אחריות מבטיחים שמערכות ה-AI שלכם יתאימו לערכים הארגוניים ויקדמו אמון.
תכנון להשגת מדרגיות
כדי להתמודד עם נפחי נתונים גדלים ועם דרישות משתמשים, וכדי למקסם את הערך של השקעות ב-AI, המערכות שלכם שמבוססות על AI ו-ML צריכות להיות ניתנות להרחבה. המערכות צריכות להסתגל ולפעול בצורה אופטימלית כדי למנוע צווארי בקבוק בביצועים שיפגעו ביעילות. כשמתכננים מתוך מחשבה על מדרגיות, מוודאים שהתשתית של ה-AI תוכל להתמודד עם צמיחה ולשמור על היענות. שימוש בתשתית שניתנת להרחבה, תכנון קיבולת ושימוש בשיטות כמו הרחבה אופקית ושירותים מנוהלים.
כדי לתכנן את מערכות ה-AI וה-ML כך שיהיה אפשר להרחיב אותן, כדאי להביא בחשבון את ההמלצות הבאות.
תכנון בהתאם לקיבולת ולמכסות
להעריך את הצמיחה העתידית ולתכנן בהתאם את קיבולת התשתית ואת מכסות המשאבים. כדאי לעבוד עם בעלי עניין בעסק כדי להבין את הצמיחה הצפויה, ואז להגדיר את דרישות התשתית בהתאם.
אפשר להשתמש ב-Cloud Monitoring כדי לנתח את ניצול המשאבים לאורך זמן, לזהות מגמות ולחזות את הצרכים העתידיים. מומלץ לבצע בדיקות עומס באופן קבוע כדי לדמות עומסי עבודה ולזהות צווארי בקבוק.
חשוב להכיר את Google Cloud המכסות של השירותים שבהם אתם משתמשים, כמו Compute Engine, Vertex AI ו-Cloud Storage. כדאי לבקש מראש הגדלה של המכסה דרך Google Cloud המסוף, ולנמק את הבקשה באמצעות נתונים מחיזוי ומבדיקות עומס. מעקב אחרי השימוש במכסות והגדרת התראות כדי לקבל עדכונים כשמתקרבים למגבלות המכסות.
כדי לייעל את השימוש במשאבים לפי הביקוש, צריך לבחור את הגודל המתאים למשאבים, להשתמש במכונות וירטואליות מסוג Spot לעומסי עבודה של אצווה עם עמידות בפני תקלות ולהטמיע התאמה אוטומטית לעומס.
הכנה לאירועים בקיבולת שיא
חשוב לוודא שהמערכת יכולה להתמודד עם עליות פתאומיות בתנועת הגולשים או בעומס העבודה במהלך אירועים מרכזיים. כדאי לתעד את אסטרטגיית השיא של האירוע ולבצע תרגילים קבועים כדי לבדוק את היכולת של המערכת להתמודד עם עומס מוגבר.
כדי להגדיל את המשאבים באופן משמעותי כשעומס הביקוש עולה, צריך להגדיר מדיניות של התאמה אוטומטית לעומס ב-Compute Engine וב-GKE. כדי להתמודד עם דפוסי שימוש צפויים בשעות השיא, כדאי להשתמש בשינוי גודל אוטומטי חזוי. כדי להפעיל התאמה אוטומטית לעומס על סמך אותות ספציפיים לאפליקציה, משתמשים במדדים מותאמים אישית ב-Cloud Monitoring.
אפשר להשתמש ב-Cloud Load Balancing כדי להפיץ את התנועה בין כמה מופעים של אפליקציות. בוחרים את סוג מאזן העומסים המתאים בהתאם לצרכים של האפליקציה. אם יש לכם משתמשים שמפוזרים גיאוגרפית, אתם יכולים להשתמש באיזון עומסים גלובלי כדי להפנות את התנועה למופע הזמין הקרוב ביותר. בארכיטקטורות מורכבות שמבוססות על מיקרו-שירותים, כדאי להשתמש ב-Cloud Service Mesh.
שמירת תוכן סטטי במטמון בקצה הרשת של Google באמצעות Cloud CDN. כדי לשמור במטמון נתונים שניגשים אליהם לעיתים קרובות, אפשר להשתמש ב-Memorystore, שירות מנוהל לחלוטין בזיכרון ל-Redis, Valkey או Memcached.
הפרדה בין רכיבי המערכת באמצעות Pub/Sub להעברת הודעות בזמן אמת ו-Cloud Tasks להרצת משימות אסינכרוניות
התאמת אפליקציות לסביבת ייצור
כדי להבטיח מילוי בקשות בהיקף נרחב בסביבת ייצור, אפשר להשתמש בשירותים מנוהלים כמו Vertex AI distributed training ו-Vertex AI Inference. Vertex AI Inference מאפשרת לכם להגדיר את סוגי המכונות של צמתי החיזוי כשאתם פורסים מודל לנקודת קצה או כשאתם שולחים בקשות לחיזוי באצווה. בחלק מהתצורות אפשר להוסיף כרטיסי GPU. בוחרים את סוג המכונה והמאיצים המתאימים כדי לבצע אופטימיזציה של זמן האחזור, התפוקה והעלות.
כדי להרחיב אפליקציות מורכבות של AI ו-Python ועומסי עבודה בהתאמה אישית במשאבי מחשוב מבוזרים, אפשר להשתמש ב-Ray ב-Vertex AI. התכונה הזו יכולה לעזור לכם לבצע אופטימיזציה של הביצועים ולאפשר שילוב חלק עם שירותים שלGoogle Cloud . Ray ב-Vertex AI מפשט את המחשוב המבוזר על ידי טיפול בניהול האשכולות, בתזמון המשימות ובהעברת הנתונים. הוא משולב עם שירותים אחרים של Vertex AI כמו אימון, חיזוי וצינורות נתונים. Ray מספק סבילות לתקלות ושינוי גודל אוטומטי, ועוזר להתאים את התשתית לעומסי עבודה משתנים. היא מציעה מסגרת מאוחדת לאימון מבוזר, לכוונון היפר-פרמטרים, ללמידה חיזוקית ולפריסת מודלים. אפשר להשתמש ב-Ray לעיבוד מקדים מבוזר של נתונים באמצעות Dataflow או Dataproc, לאימון מודלים מואץ, לכוונון היפר-פרמטרים מדרגי, ללמידת חיזוק ולחיזוי באצווה במקביל.
שותפים ביצירת התוכן
מחברים:
- Charlotte Gistelinck, PhD | Partner Engineer
- סניה דאנג | אדריכלית פתרונות AI
- Filipe Gracio, PhD | Customer Engineer, AI/ML Specialist
תורמי תוכן אחרים:
- גארי הרמסון (Gary Harmson) | אדריכל ראשי
- קומאר דהנגופאל | מפתח פתרונות חוצי-מוצרים
- Marwan Al Shawi | Partner Customer Engineer
- ריאן קוקס (Ryan Cox) | אדריכל ראשי
- Stef Ruinard | Generative AI Field Solutions Architect