סקירה כללית של עיבוד מקדים של תכונות
עיבוד מקדים של תכונות הוא אחד השלבים החשובים ביותר במחזור החיים של למידת מכונה. היא כוללת יצירת תכונות וניקוי של נתוני ההדרכה. יצירת תכונות נקראת גם הנדסת פיצ'רים (feature engineering).
BigQuery ML מספק את הטכניקות הבאות לעיבוד מקדים של פיצ'רים:
עיבוד מקדים אוטומטי. מערכת BigQuery ML מבצעת עיבוד מקדים אוטומטי במהלך האימון. מידע נוסף זמין במאמר בנושא עיבוד מקדים אוטומטי של תכונות.
עיבוד מקדים ידני. אפשר להשתמש בסעיף
TRANSFORMבהצהרתCREATE MODELכדי להגדיר עיבוד מקדים בהתאמה אישית באמצעות פונקציות של עיבוד מקדים ידני. אפשר להשתמש בפונקציות האלה גם מחוץ לסעיףTRANSFORMכדי לעבד נתוני אימון לפני יצירת המודל.
קבלת מידע על תכונות
אפשר להשתמש בפונקציה ML.FEATURE_INFO כדי לאחזר את הנתונים הסטטיסטיים של כל עמודות מאפייני הקלט.
ידע מומלץ
באמצעות הגדרות ברירת המחדל בהצהרות CREATE MODEL ובפונקציות ההיקש, אפשר ליצור מודלים של BigQuery ML ולהשתמש בהם גם בלי ידע רב בלמידת מכונה. עם זאת, ידע בסיסי במחזור החיים של פיתוח ML, כמו הנדסת פיצ'רים (feature engineering) ואימון מודלים, עוזר לבצע אופטימיזציה של הנתונים ושל המודל כדי להשיג תוצאות טובות יותר. כדי להכיר את התהליכים והטכניקות של ML, מומלץ להיעזר במקורות המידע הבאים:
- קורס מקוצר על למידת מכונה
- מבוא ללמידת מכונה
- ניקוי נתונים
- Feature Engineering
- למידת מכונה ברמה בינונית
המאמרים הבאים
- מידע נוסף על ייצוא מאפיינים ב-BigQuery ML.
מידע נוסף על פונקציות והצהרות SQL נתמכות עבור מודלים שתומכים בעיבוד מקדים של תכונות זמין במסמכים הבאים: