Vertex AI מאפשרת לכם לבצע למידת מכונה עם נתונים טבלאיים באמצעות תהליכים וממשקים פשוטים. אפשר ליצור את סוגי המודלים הבאים לבעיות שקשורות לנתונים טבלאיים:
- מודלים של סיווג בינארי חוזים תוצאה בינארית (אחת משתי קטגוריות). משתמשים בסוג המודל הזה לשאלות שהתשובה עליהן היא כן או לא. לדוגמה, יכול להיות שתרצו ליצור מודל סיווג בינארי כדי לחזות אם לקוח ירכוש מינוי. באופן כללי, בעיה של סיווג בינארי דורשת פחות נתונים מאשר סוגים אחרים של מודלים.
- מודלים של סיווג רב-מחלקתי חוזים מחלקה אחת מתוך שלוש מחלקות נפרדות או יותר. משתמשים בסוג המודל הזה לסיווג. לדוגמה, אם אתם קמעונאים, יכול להיות שתרצו לבנות מודל סיווג רב-מחלקתי כדי לפלח לקוחות לפי פרסונות שונות.
- מודלים של רגרסיה חוזים ערך רציף. לדוגמה, אם אתם קמעונאים, יכול להיות שתרצו ליצור מודל רגרסיה כדי לחזות כמה לקוח יוציא בחודש הבא.
- מודלים של חיזוי חוזים רצף של ערכים. לדוגמה, קמעונאים יכולים להשתמש בתחזיות כדי לחזות את הביקוש היומי למוצרים שלהם ב-3 החודשים הבאים, וכך להתכונן מראש ולדאוג למלאי מתאים.
לקבלת מבוא ללמידת מכונה עם נתונים טבלאיים, אפשר לעיין במאמר מבוא לנתונים טבלאיים. למידע נוסף על פתרונות Vertex AI, אפשר לעיין במאמרים פתרונות Vertex AI לסיווג ולרגרסיה ופתרונות Vertex AI לחיזוי.
הערה לגבי הוגנות
Google מחויבת להתקדמות ביישום שיטות לפיתוח אחראי של AI. לכן, מוצרי ה-ML שלנו, כולל AutoML, מבוססים על עקרונות ליבה כמו הוגנות ולמידת מכונה שמתמקדת באדם. מידע נוסף על שיטות מומלצות לצמצום הטיה כשבונים מערכת ML משלכם זמין במאמר מדריך ל-ML כולל – AutoML.
פתרונות של Vertex AI לסיווג ולרגרסיה
Vertex AI מציע את הפתרונות הבאים לסיווג ולרגרסיה:
תהליך עבודה טבלאי של AutoML מקצה לקצה
Tabular Workflow for End-to-End AutoML הוא צינור AutoML מלא למשימות סיווג ורגרסיה. הוא דומה ל-AutoML API, אבל מאפשר לכם לבחור מה לשלוט ומה להפוך לאוטומטי. במקום אמצעי בקרה לכל הצינור, יש אמצעי בקרה לכל שלב בצינור. אמצעי הבקרה של הצינור כוללים:
- פיצול נתונים
- Feature engineering
- חיפוש אדריכלות
- אימון המודל
- שילוב מודלים
- זיקוק מודלים
יתרונות
- תמיכה במערכי נתונים גדולים בגודל של כמה טרה-בייט ועד 1,000 עמודות.
- האפשרות הזו מאפשרת לכם לשפר את היציבות ולקצר את זמן האימון על ידי הגבלת מרחב החיפוש של סוגי הארכיטקטורה או דילוג על חיפוש הארכיטקטורה.
- האפשרות הזו מאפשרת לכם לשפר את מהירות האימון על ידי בחירה ידנית של החומרה שמשמשת לאימון ולחיפוש ארכיטקטורה.
- מאפשרת להקטין את גודל המודל ולשפר את זמן האחזור באמצעות זיקוק או שינוי גודל האנסמבל.
- אפשר לבדוק כל רכיב של AutoML בממשק גרפי רב-עוצמה של צינורות, שמאפשר לראות את טבלאות הנתונים שעברו טרנספורמציה, את ארכיטקטורות המודלים שנבדקו ועוד הרבה פרטים.
- כל רכיב AutoML מקבל גמישות ושקיפות מורחבות, כמו היכולת להתאים אישית פרמטרים, חומרה, להציג את סטטוס התהליך, יומנים ועוד.
מידע נוסף על Tabular Workflows ב-Vertex AI מידע נוסף על Tabular Workflow for End-to-End AutoML (תהליך עבודה של טבלאות ל-AutoML מקצה לקצה) זמין במאמר Tabular Workflow for End-to-End AutoML.
תהליך עבודה טבלאי ל-TabNet
תהליך העבודה הטבלאי של TabNet הוא צינור עיבוד נתונים שאפשר להשתמש בו כדי לאמן מודלים של סיווג או רגרסיה. TabNet משתמש בתשומת לב רציפה כדי לבחור את התכונות שמהן יוסקו מסקנות בכל שלב של קבלת החלטה. השיטה הזו מקדמת פרשנות ולמידה יעילה יותר, כי יכולת הלמידה משמשת לתכונות הבולטות ביותר.
יתרונות
- המערכת בוחרת באופן אוטומטי את מרחב החיפוש המתאים של היפר-פרמטרים על סמך גודל מערך הנתונים, סוג ההיקש ותקציב האימון.
- משולב עם Vertex AI. המודל המאומן הוא מודל Vertex AI. אתם יכולים להריץ מסקנות באצווה או לפרוס את המודל למסקנות אונליין באופן מיידי.
- מספק יכולת מובנית לפרשנות של המודל. אתם יכולים לקבל תובנות לגבי התכונות שבהן נעשה שימוש ב-TabNet כדי לקבל את ההחלטה.
- תמיכה באימון GPU.
מידע נוסף על Tabular Workflows ב-Vertex AI מידע נוסף על Tabular Workflow for TabNet
סיווג ורגרסיה באמצעות AutoML
Vertex AI מציע צינורות עיבוד נתונים משולבים ומנוהלים במלואם למשימות סיווג או רגרסיה מקצה לקצה. Vertex AI מחפש את קבוצת ההיפרפרמטרים האופטימלית, מאמן כמה מודלים עם כמה קבוצות של היפרפרמטרים, ואז יוצר מודל סופי יחיד מתוך קבוצה של המודלים המובילים. Vertex AI מתבסס על רשתות נוירונים ועצים מחוזקים לסוגי המודלים.
יתרונות
- קל לשימוש: Vertex AI בוחר בשבילכם את סוג המודל, הפרמטרים של המודל והחומרה.
מידע נוסף מפורט בסקירה הכללית בנושא סיווג ורגרסיה.
פתרונות של Vertex AI לחיזוי
Vertex AI מציע את הפתרונות הבאים ליצירת תחזיות:
- תהליך עבודה טבלאי ליצירת תחזיות
- תחזיות באמצעות AutoML
- חיזוי באמצעות ARIMA_PLUS ב-BigQuery ML
- יצירת תחזיות באמצעות Prophet
תהליך עבודה טבלאי ליצירת תחזיות
תהליך העבודה הטבלאי ליצירת תחזיות הוא צינור מלא למשימות של יצירת תחזיות. הוא דומה ל-AutoML API, אבל מאפשר לכם לבחור מה לשלוט ומה להפוך לאוטומטי. במקום אמצעי בקרה לכל הצינור, יש אמצעי בקרה לכל שלב בצינור. אמצעי הבקרה של הצינור כוללים:
- פיצול נתונים
- Feature engineering
- חיפוש אדריכלות
- אימון המודל
- שילוב מודלים
יתרונות
- תמיכה במערכי נתונים גדולים בגודל של עד 1TB ועם עד 200 עמודות.
- האפשרות הזו מאפשרת לשפר את היציבות ולקצר את זמן האימון על ידי הגבלת מרחב החיפוש של סוגי הארכיטקטורה או דילוג על חיפוש הארכיטקטורה.
- אפשר לשפר את מהירות האימון על ידי בחירה ידנית של החומרה שמשמשת לאימון ולחיפוש ארכיטקטורה.
- אפשר להקטין את גודל המודל ולשפר את זמן האחזור על ידי שינוי גודל האנסמבל.
- אפשר לבדוק כל רכיב בממשק גרפי רב-עוצמה של צינורות, שמאפשר לראות את טבלאות הנתונים שעברו טרנספורמציה, את ארכיטקטורות המודלים שנבדקו ועוד הרבה פרטים.
- כל רכיב מקבל גמישות ושקיפות מורחבות, כמו היכולת להתאים אישית פרמטרים, חומרה, סטטוס תהליך הצפייה, יומנים ועוד.
מידע נוסף על Tabular Workflows ב-Vertex AI מידע נוסף על תהליך עבודה טבלאי לחיזוי זמין במאמר תהליך עבודה טבלאי לחיזוי.
חיזוי באמצעות AutoML
Vertex AI מציע צינור משולב ומנוהל באופן מלא למשימות חיזוי מקצה לקצה. Vertex AI מחפש את קבוצת ההיפרפרמטרים האופטימלית, מאמן כמה מודלים עם כמה קבוצות של היפרפרמטרים, ואז יוצר מודל סופי יחיד מתוך קבוצה של המודלים המובילים. אפשר לבחור בין Time series Dense Encoder (TiDE), Temporal Fusion Transformer (TFT), AutoML (L2L) ו-Seq2Seq+ כשיטה לאימון המודל. Vertex AI מתייחס רק לרשתות נוירונים כסוג המודל.
יתרונות
- קל לשימוש: Vertex AI בוחר בשבילכם את פרמטרים של המודל ואת החומרה.
מידע נוסף זמין במאמר סקירה כללית על תחזיות.
חיזוי באמצעות ARIMA_PLUS ב-BigQuery ML
BigQuery ML ARIMA_PLUS הוא מודל חיזוי חד-משתני. כמודל סטטיסטי, האימון שלו מהיר יותר מאימון של מודל שמבוסס על רשתות נוירונים. מומלץ לאמן מודל ARIMA_PLUS של BigQuery ML אם צריך לבצע הרבה איטרציות מהירות של אימון מודלים, או אם צריך בסיס השוואה זול למדידה של מודלים אחרים.
בדומה ל-Prophet, BigQuery ML ARIMA_PLUS מנסה לפרק כל סדרת זמן למגמות, לעונות ולחגים, ומפיק תחזית באמצעות צבירה של ההסקות של המודלים האלה. אחד ההבדלים הרבים הוא שב-BQML ARIMA+ נעשה שימוש ב-ARIMA כדי ליצור מודל של רכיב המגמה, ואילו ב-Prophet נעשה ניסיון להתאים עקומה באמצעות מודל לוגיסטי או ליניארי מקוטע.
Google Cloud מציע צינור להרצת אימון של מודל ARIMA_PLUS ב-BigQuery ML וצינור לקבלת מסקנות אצווה ממודל ARIMA_PLUS ב-BigQuery ML. שני צינורות העיבוד הם מופעים של Vertex AI Pipelines מתוך Google Cloud Pipeline Components (GCPC).
יתרונות
- קל לשימוש: BigQuery בוחר בשבילכם את פרמטרים של המודל ואת החומרה.
- מהיר: אימון המודל מספק בסיס בעלות נמוכה להשוואה עם מודלים אחרים.
מידע נוסף זמין במאמר בנושא תחזיות עם ARIMA+.
חיזוי באמצעות Prophet
Prophet הוא מודל חיזוי שמתוחזק על ידי Meta. פרטים על האלגוריתם מופיעים במאמר על Prophet, ומידע נוסף על הספרייה מופיע במסמכי התיעוד.
בדומה ל-BigQuery ML ARIMA_PLUS, Prophet מנסה לפרק כל סדרת זמן למגמות, לעונות ולחגים, וליצור תחזית באמצעות צבירה של ההסקות של המודלים האלה. עם זאת, יש הבדל חשוב: ב-BQML ARIMA+ נעשה שימוש ב-ARIMA כדי ליצור מודל של רכיב המגמה, ואילו ב-Prophet נעשה ניסיון להתאים עקומה באמצעות מודל לוגיסטי או ליניארי חלקי.
Google Cloud offers a pipeline for training a Prophet model and a pipeline for getting batch inferences from a Prophet model. שני צינורות העיבוד הם מופעים של Vertex AI Pipelines מתוך Google Cloud Pipeline Components (GCPC).
שילוב של Prophet עם Vertex AI מאפשר לכם:
- משתמשים בפיצול נתונים ובשיטות חלוקה לחלונות ב-Vertex AI.
- קריאת נתונים מטבלאות BigQuery או מקובצי CSV שמאוחסנים ב-Cloud Storage. ב-Vertex AI, כל שורה צריכה להיות באותו פורמט כמו ב-Vertex AI Forecasting.
למרות ש-Prophet הוא מודל רב-משתני, Vertex AI תומך רק בגרסה חד-משתנית שלו.
יתרונות
- גמיש: אפשר לשפר את מהירות האימון על ידי בחירת החומרה שמשמשת לאימון
מידע נוסף זמין במאמר בנושא תחזיות באמצעות Prophet.
המאמרים הבאים
- מידע נוסף על למידת מכונה עם נתונים טבלאיים
- מידע על סיווג ורגרסיה באמצעות AutoML
- מידע על תחזיות באמצעות AutoML
- מידע על תחזיות עם Prophet
- מידע נוסף על חיזוי באמצעות BigQuery ML ARIMA_PLUS
- מידע נוסף על תהליכי עבודה של טבלאות