במדריך הזה מוסבר איך להשתמש ב-Vertex AI SDK ל-Python כדי ליצור מודל שעבר אימון בהתאמה אישית. מריצים קוד בקובץ מחברת (IPYNB) שמשתמש בקונטיינר Docker כדי לאמן את המודל וליצור אותו. המדריך מיועד למדעני נתונים שחדשים ב-Vertex AI ומכירים את מסמכי ה-Notebook, את Python ואת תהליך העבודה של למידת מכונה (ML).
התהליך מתחיל ביצירת הפרויקט שמכיל את העבודה שלכם באמצעות המסוף Google Cloud . בפרויקט, משתמשים ב-Vertex AI Workbench כדי ליצור notebook של Jupyter. בסביבת המחברת מריצים קוד שמוריד ומכין מערך נתונים, ואז משתמשים במערך הנתונים כדי ליצור ולאמן מודל. בסוף המדריך, המודל המאומן יוצר תחזיות.
מטרת המדריך הזה היא להסביר לכם כל שלב שנדרש ליצירת תחזיות בפחות משעה. מערך הנתונים שבו משתמשים קטן יחסית, כדי שאימון המודל לא ייקח הרבה זמן. אחרי שמסיימים, אפשר להחיל את מה שלומדים על מערכי נתונים גדולים יותר. ככל שמערך הנתונים גדול יותר, כך התחזיות מדויקות יותר.
שלבים במדריך
דרישות מוקדמות – צריך ליצור חשבון ופרויקט. Google Cloud
יצירת Notebook – יצירה והכנה של Notebook של Jupyter והסביבה שלו. אתם משתמשים במחברת כדי להריץ קוד שיוצר את מערך הנתונים, יוצר ומאמן את המודל ומפיק את התחזיות.
יצירת מערך נתונים – מורידים מערך נתונים ציבורי שזמין ב-BigQuery, ואז משתמשים בו כדי ליצור מערך נתונים טבלאי ב-Vertex AI. מערך הנתונים מכיל את הנתונים שבהם אתם משתמשים כדי לאמן את המודל.
יצירת סקריפט אימון – יוצרים סקריפט Python שמעבירים למשימת האימון. הסקריפט מופעל כשפעולת האימון מאמנת את המודל ויוצרת אותו.
אימון מודל – שימוש במערך נתונים טבלאי כדי לאמן ולפרוס מודל. אתם משתמשים במודל כדי ליצור את התחזיות.
יצירת תחזיות – שימוש במודל כדי ליצור תחזיות. בקטע הזה מוסבר גם איך למחוק משאבים שיוצרים במהלך ההפעלה של המדריך הזה, כדי שלא תחויבו על שימוש לא נחוץ.
מה אפשר לעשות
במדריך הזה נסביר איך להשתמש ב-Vertex AI SDK ל-Python כדי לבצע את הפעולות הבאות:
- יצירת קטגוריה של Cloud Storage לאחסון מערך נתונים
- עיבוד מקדים של נתונים לאימון
- שימוש בנתונים המעובדים כדי ליצור מערך נתונים ב-BigQuery
- שימוש במערך הנתונים ב-BigQuery כדי ליצור מערך נתונים טבלאי ב-Vertex AI
- יצירה ואימון של מודלים עם אימון בהתאמה אישית
- פריסת המודל שאומן בהתאמה אישית לנקודת קצה
- יצירת תחזית
- ביטול הפריסה של המודל
- כדי שלא תחויבו בעלויות נוספות, צריך למחוק את כל המשאבים שנוצרו במדריך
משאבים שניתן לחייב עליהם
במדריך הזה נעשה שימוש במשאבים שחלים עליהם חיובים שמשויכים לשירותים Vertex AI, BigQuery ו-Cloud Storage Google Cloud . אם אתם חדשים ב- Google Cloud, יכול להיות שתוכלו להשתמש באחד או יותר מהשירותים האלה ללא עלות. לקוחות חדשים מקבלים קרדיט בשווי 300 $ ב-Vertex AI, וב-Cloud Storage וב-BigQuery יש תוכניות ללא תשלום. למידע נוסף, קראו את המאמרים הבאים:
- תמחור ב-Vertex AI ותכונות חינמיות בענן ותקופת ניסיון
- התמחור של BigQuery והשימוש בחבילה החינמית של BigQuery
- התמחור של Cloud Storage והשימוש במסלול החינמי של Cloud Storage
- Google Cloud מחשבון תמחור
כדי למנוע חיובים נוספים, בשלב האחרון של המדריך הזה מוסבר איך להסיר את כל המשאבים שניתנים לחיוב Google Cloud שיצרתם.