סקירה כללית של עיבוד מקדים של תכונות

עיבוד מקדים של תכונות הוא אחד השלבים החשובים ביותר במחזור החיים של למידת מכונה. היא כוללת יצירת תכונות וניקוי של נתוני ההדרכה. יצירת תכונות נקראת גם הנדסת פיצ'רים (feature engineering).

‫BigQuery ML מספק את הטכניקות הבאות לעיבוד מקדים של פיצ'רים:

  • עיבוד מקדים אוטומטי. מערכת BigQuery ML מבצעת עיבוד מקדים אוטומטי במהלך האימון. מידע נוסף זמין במאמר בנושא עיבוד מקדים אוטומטי של תכונות.

  • עיבוד מקדים ידני. אפשר להשתמש בסעיף TRANSFORM בהצהרת CREATE MODEL כדי להגדיר עיבוד מקדים בהתאמה אישית באמצעות פונקציות של עיבוד מקדים ידני. אפשר להשתמש בפונקציות האלה גם מחוץ לסעיף TRANSFORM כדי לעבד נתוני אימון לפני יצירת המודל.

קבלת מידע על תכונות

אפשר להשתמש בפונקציה ML.FEATURE_INFO כדי לאחזר את הנתונים הסטטיסטיים של כל עמודות מאפייני הקלט.

באמצעות הגדרות ברירת המחדל בהצהרות CREATE MODEL ובפונקציות ההיקש, אפשר ליצור מודלים של BigQuery ML ולהשתמש בהם גם בלי ידע רב בלמידת מכונה. עם זאת, ידע בסיסי במחזור החיים של פיתוח ML, כמו הנדסת פיצ'רים (feature engineering) ואימון מודלים, עוזר לבצע אופטימיזציה של הנתונים ושל המודל כדי להשיג תוצאות טובות יותר. כדי להכיר את התהליכים והטכניקות של ML, מומלץ להיעזר במקורות המידע הבאים:

המאמרים הבאים