סקירה כללית על סידור באשכולות

קלאסטרינג היא טכניקה של למידת מכונה לא מפוקחת שבה אפשר להשתמש כדי לקבץ רשומות דומות. זו גישה שימושית כשרוצים להבין אילו קבוצות או אשכולות יש בנתונים, אבל אין נתונים מסומנים לאימון המודל. לדוגמה, אם יש לכם נתונים לא מסומנים לגבי רכישות של כרטיסים לרכבת התחתית, תוכלו לאגד את הנתונים האלה לפי שעת הרכישה של הכרטיס כדי להבין טוב יותר באילו תקופות יש הכי הרבה שימוש ברכבת התחתית. מידע נוסף זמין במאמר מה זה אשכול?

מודלים של K-means נמצאים בשימוש נרחב לביצוע אשכולות. אפשר להשתמש במודלים של k-means עם הפונקציה ML.PREDICT כדי לבצע אשכול נתונים, או עם הפונקציה ML.DETECT_ANOMALIES כדי לבצע זיהוי אנומליות.

מודלים של K-means משתמשים באשכול מבוסס-צנטרואיד כדי לארגן נתונים באשכולות. כדי לקבל מידע על מרכזי הכובד של מודל k-means, אפשר להשתמש בפונקציה ML.CENTROIDS.

באמצעות הגדרות ברירת המחדל בהצהרות CREATE MODEL ובפונקציות ההסקה, אפשר ליצור ולהשתמש במודל אשכולות גם בלי ידע רב ב-ML. עם זאת, ידע בסיסי בפיתוח למידת מכונה, ובמודלים של אשכולות בפרט, יעזור לכם לבצע אופטימיזציה של הנתונים ושל המודל כדי להשיג תוצאות טובות יותר. כדי להכיר את התהליכים והטכניקות של ML, מומלץ להיעזר במקורות המידע הבאים: