סקירה כללית של היקש המודל
במסמך הזה מתוארים סוגי ההסקה באצווה ש-BigQuery ML תומך בהם, כולל:
הסקת מסקנות בלמידת מכונה היא תהליך של הפעלת נקודות נתונים במודל למידת מכונה כדי לחשב פלט, כמו ציון מספרי יחיד. התהליך הזה נקרא גם 'הפעלת מודל של למידת מכונה' או 'העברת מודל של למידת מכונה לייצור'.
תחזית באצווה
בקטעים הבאים מתוארות הדרכים הזמינות לביצוע חיזוי ב-BigQuery ML.
הסקת מסקנות באמצעות מודלים שאומנו ב-BigQuery ML
חיזוי ב-BigQuery ML משמש לא רק למודלים של למידה מפוקחת, אלא גם למודלים של למידה לא מפוקחת.
BigQuery ML תומך בפונקציות חיזוי באמצעות הפונקציה ML.PREDICT, עם המודלים הבאים:
| קטגוריית מודל | סוגי מודלים | מה ML.PREDICT עושה |
|---|---|---|
| למידה מפוקחת |
רגרסיה לינארית ולוגיסטית עצים מחוזקים יער אקראי רשתות נוירונים עמוקות רשתות רחבות ועמוקות AutoML Tables |
חיזוי התווית, ערך מספרי למשימות רגרסיה או ערך קטגורי למשימות סיווג. |
| למידה לא מפוקחת | K-means | מקצים את האשכול לישות. |
| PCA | מבצעים הפחתת ממדים לישות על ידי המרה שלה למרחב שנפרש על ידי הווקטורים העצמיים. | |
| Autoencoder | להפוך את הישות למרחב המוטמע. |
הסקת מסקנות באמצעות מודלים מיובאים
בגישה הזו, יוצרים ומאמנים מודל מחוץ ל-BigQuery, מייבאים אותו באמצעות ההצהרה CREATE MODEL, ואז מריצים עליו הסקה באמצעות הפונקציה ML.PREDICT.
כל העיבוד של ההסקה מתבצע ב-BigQuery, באמצעות נתונים מ-BigQuery. מודלים מיובאים יכולים לבצע למידה מפוקחת או למידה לא מפוקחת.
BigQuery ML תומך בסוגים הבאים של מודלים מיובאים:
- Open Neural Network Exchange (ONNX) למודלים שאומנו ב-PyTorch, ב-scikit-learn ובמסגרות פופולריות אחרות של ML.
- TensorFlow
- TensorFlow Lite
- XGBoost
אפשר להשתמש בגישה הזו כדי להפיק תועלת ממודלים מותאמים אישית שפותחו באמצעות מגוון מסגרות של למידת מכונה, תוך ניצול מהירות ההסקה של BigQuery ML והמיקום המשותף עם הנתונים.
כדי לקבל מידע נוסף, אפשר לנסות את אחד מהמדריכים הבאים:
- קבלת חיזויים באמצעות מודלים מיובאים של TensorFlow
- יצירת תחזיות באמצעות מודלים של scikit-learn בפורמט ONNX
- יצירת תחזיות באמצעות מודלים של PyTorch בפורמט ONNX
הסקת מסקנות באמצעות מודלים מרוחקים
בגישה הזו, אפשר ליצור הפניה למודל שמתארח ב-Vertex AI Inference באמצעות ההצהרה CREATE MODEL, ואז להריץ עליו הסקה באמצעות הפונקציה ML.PREDICT.
כל עיבוד ההסקה מתבצע בפלטפורמת הסוכנים, באמצעות נתונים מ-BigQuery. מודלים מרוחקים יכולים לבצע למידה מונחית או לא מונחית.
אפשר להשתמש בגישה הזו כדי להריץ הסקה על מודלים גדולים שנדרשת להם תמיכה בחומרה של GPU, כמו זו שמסופקת על ידי Agent Platform. אם רוב המודלים שלכם מתארחים ב-Agent Platform, תוכלו גם להריץ הסקה על המודלים האלה באמצעות SQL, בלי שתצטרכו ליצור באופן ידני צינורות נתונים כדי להעביר נתונים ל-Agent Platform ולהחזיר את תוצאות החיזוי ל-BigQuery.
הוראות מפורטות מופיעות במאמר בנושא ביצוע חיזויים באמצעות מודלים מרוחקים ב-Agent Platform.
הסקת מסקנות באצווה באמצעות מודלים של BigQuery ב-Agent Platform
ל-BigQuery ML יש תמיכה מובנית בחיזוי אצווה, בלי הצורך להשתמש ב-Agent Platform. אפשר גם לרשום מודל של BigQuery ML במרשם המודלים כדי לבצע חיזוי אצווה ב-Agent Platform באמצעות טבלה ב-BigQuery כקלט. עם זאת, אפשר לעשות זאת רק באמצעות Agent Platform API, ולהגדיר את InstanceConfig.instanceType לערך object.
חיזוי אונליין
יכולת ההסקה המובנית של BigQuery ML מותאמת לתרחישי שימוש בקנה מידה גדול, כמו חיזוי באצווה. כשמטפלים בנתוני קלט קטנים, BigQuery ML מספק תוצאות היקש עם חביון נמוך. עם זאת, אפשר לקבל חיזויים מהירים יותר אונליין באמצעות שילוב חלק עם Gemini Enterprise Agent Platform.
אתם יכולים לנהל מודלים של BigQuery ML בסביבת פלטפורמת הסוכנים של Gemini Enterprise, מה שמבטל את הצורך לייצא מודלים מ-BigQuery ML לפני פריסתם כנקודות קצה של פלטפורמת הסוכנים של Gemini Enterprise. ניהול המודלים ב-Gemini Enterprise Agent Platform מאפשר לכם גישה לכל היכולות של MLOps ב-Gemini Enterprise Agent Platform, וגם לתכונות כמו Vertex AI Feature Store.
בנוסף, יש לכם אפשרות לייצא מודלים של BigQuery ML אל Cloud Storage כדי שהם יהיו זמינים בפלטפורמות אחרות לאירוח מודלים.
המאמרים הבאים
- מידע נוסף על שימוש במודלים של Agent Platform כדי ליצור טקסט והטמעות זמין במאמר סקירה כללית על AI גנרטיבי.
- מידע נוסף על שימוש בממשקי Cloud AI API לביצוע משימות AI זמין במאמר סקירה כללית על אפליקציות AI.
מידע נוסף על פונקציות והצהרות SQL נתמכות לסוגים שונים של מודלים זמין במאמרים הבאים: