מבוא לניהול תכונות ב-Vertex AI

בלמידת מכונה (ML), מאפיינים הם מאפיינים אופייניים של מופע או ישות שאפשר להשתמש בהם כדי לאמן מודלים או כדי לבצע חיזויים אונליין. התכונות נוצרות על ידי טרנספורמציה של נתוני ML גולמיים למאפיינים ניתנים למדידה ולשיתוף באמצעות טכניקות של הנדסת פיצ'רים (feature engineering), שבדרך כלל נקראות טרנספורמציות של תכונות.

ניהול תכונות הוא תהליך של יצירה, תחזוקה, שיתוף והצגה של תכונות של למידת מכונה שמאוחסנות במיקום או במאגר מרכזיים. ניהול התכונות מאפשר לעשות שימוש חוזר בתכונות כדי לאמן מודלים ולבצע אימון מחדש, וכך לקצר את מחזור החיים של פריסות AI ו-ML.

מוצר או שירות שכוללים שירותי ניהול תכונות לאחסון, לגילוי, לשיתוף ולשימוש בתכונות של ML נקרא מאגר תכונות. ‫Vertex AI משלב את שירותי Feature Store הבאים:

בדף הזה מוצגים שני שירותים לניהול תכונות ומוסבר מה ההבדלים ביניהם. בנוסף, מופיעה כאן סקירה כללית של היכולות שלהם. בנוסף, מוסבר במאמר איך להעביר מאגר תכונות קיים ב-Vertex AI Feature Store (גרסה קודמת) אל Vertex AI Feature Store החדש.

Vertex AI Feature Store

Vertex AI Feature Store מציע גישה חדשה לניהול תכונות, שמאפשרת לכם לתחזק את נתוני התכונות ולספק אותם ממקור נתונים של BigQuery. בגישה הזו, Vertex AI Feature Store פועל כשכבת מטא-נתונים שמספקת יכולות של מילוי בקשה באופן מיידי למקור נתוני התכונות ב-BigQuery, ומאפשרת להציג תכונות אונליין על סמך הנתונים האלה. אין צורך להעתיק או לייבא את הנתונים לחנות אופליין נפרדת ב-Vertex AI.

‫Vertex AI Feature Store משולב עם Dataplex Universal Catalog כדי לעקוב אחרי מטא-נתונים של תכונות. הוא תומך גם בהטמעות ומאפשר לבצע חיפושים של וקטורים דומים כדי למצוא את השכנים הקרובים ביותר.

‫Vertex AI Feature Store עובר אופטימיזציה כדי לספק שירות עם זמן טעינה קצר במיוחד, ומאפשר לכם:

  • אחסון ותחזוקה של נתוני התכונות במצב אופליין ב-BigQuery, תוך ניצול היכולות של BigQuery לניהול נתונים.

  • כדי לשתף תכונות ולעשות בהן שימוש חוזר, מוסיפים אותן למאגר התכונות.

  • הצגת תכונות למילוי בקשה באופן מיידי עם זמני אחזור נמוכים באמצעות Bigtable online serving.

  • מעקב אחר מטא-נתונים של תכונות ב-Dataplex Universal Catalog.

מידע נוסף על Vertex AI Feature Store זמין במסמכי התיעוד של Vertex AI Feature Store.

Vertex AI Feature Store (גרסה קודמת)

‫Vertex AI Feature Store (גרסה קודמת) מספק מאגר מרכזי לאחסון, לארגון ולהצגה של נתוני תכונות של למידת מכונה. הוא מספק היררכיית משאבים שמכילה גם חנות וירטואלית וגם חנות פיזית ב-Vertex AI. החנות הווירטואלית מציגה את הערכים העדכניים ביותר של התכונות לחיזויים אונליין. המאגר הלא מקוון מאחסן נתוני תכונות (כולל נתונים היסטוריים) ומנהל אותם. אפשר להשתמש בנתונים האלה כדי לאמן מודלים של למידת מכונה (ML).

‫Vertex AI Feature Store (גרסה קודמת) הוא שירות לניהול תכונות עם פונקציונליות מלאה, שמאפשר לכם לבצע את הפעולות הבאות:

  • תכונה לייבוא נתונים מרובים או להזנת נתונים ישירות אל מאגר הנתונים הלא מקוון ממקור נתונים, כמו קטגוריה של Cloud Storage או מקור ב-BigQuery.

  • הצגת תכונות אונליין לחיזויים.

  • תכונות של ייצוא או של הצגת נתונים בקבוצות לאימון או לניתוח של מודלים של למידת מכונה.

  • הגדרת כללי מדיניות של ניהול זהויות והרשאות גישה (IAM) במשאבים של EntityType ושל Featurestore.

  • ניהול משאבים של מאגר תכונות דרך מסוף Google Cloud .

‫Vertex AI Feature Store (גרסה קודמת) לא כולל ניהול של הטמעות או יכולות אחזור של וקטורים. אם אתם צריכים לנהל הטמעות בנתוני התכונות, כדאי לכם להשתמש ב-Vector Search. אם אתם צריכים לבצע חיפושים של דמיון וקטורי, אתם צריכים לעבור אל Vertex AI Feature Store. מידע על מעבר אל Vertex AI Feature Store זמין במאמר מעבר אל Vertex AI Feature Store.

מידע נוסף על Vertex AI Feature Store (גרסה קודמת) זמין במסמכי התיעוד של Vertex AI Feature Store (גרסה קודמת).

העברה אל Vertex AI Feature Store

‫Vertex AI Feature Store (Legacy) הוא מוצר שיצא משימוש. אם אתם משתמשים קיימים ב-Vertex AI Feature Store (גרסה קודמת) ורוצים להעביר את הפרויקט שלכם ל-Vertex AI Feature Store, אתם צריכים לבצע את השלבים הבאים. שימו לב: ההיררכיה של המשאבים ב-Vertex AI Feature Store שונה מההיררכיה של המשאבים ב-Vertex AI Feature Store (גרסה קודמת). לכן, תצטרכו ליצור את המשאבים באופן ידני אחרי שתעבירו את נתוני התכונות.

  1. אם נתוני התכונות לא זמינים כבר ב-BigQuery, צריך לייצא את נתוני התכונות ל-BigQuery וליצור טבלאות ותצוגות ב-BigQuery. כשמייצאים ומכינים את הנתונים, צריך לפעול לפי ההנחיות להכנת הנתונים. לדוגמה:

    • כל תכונה מתאימה לעמודה. מזהי היישות יכולים להיות בעמודה נפרדת, שאפשר לזהות אותה כעמודה ID.

    • ל-Vertex AI Feature Store אין את המשאבים EntityType ו-Entity. מציינים את ערכי התכונות לכל ישות בשורה שמתאימה למזהה ישות ב-SAML.

  2. אופציונלי: רושמים את מקור הנתונים של התכונות על ידי הוספת קבוצות של תכונות ותכונות. מידע נוסף זמין במאמרים בנושא יצירת קבוצת תכונות ויצירת תכונה.

  3. מגדירים מילוי בקשה באופן מיידי על ידי יצירת מופעים של חנות וירטואלית ותצוגת תכונות על סמך נתוני התכונות.

מה השלב הבא?