בקטעים הבאים מוצג מודל הנתונים של Vertex AI Feature Store (Legacy) ומוסברים המונחים שמשמשים לתיאור המשאבים והרכיבים של Vertex AI Feature Store (Legacy).
מודל הנתונים של Vertex AI Feature Store (גרסה קודמת)
ב-Vertex AI Feature Store (גרסה קודמת) נעשה שימוש במודל נתונים של סדרת זמנים כדי לאחסן סדרה של ערכים של תכונות. המודל הזה מאפשר ל-Vertex AI Feature Store (גרסה קודמת) לשמור על ערכי התכונות כשהם משתנים לאורך זמן. ב-Vertex AI Feature Store (גרסה קודמת), המשאבים מסודרים בהיררכיה לפי הסדר הבא: Featurestore -> EntityType -> Feature. צריך ליצור את המשאבים האלה לפני שניתן לייבא נתונים אל Vertex AI Feature Store (גרסה קודמת).
לדוגמה, נניח שיש לכם את נתוני המקור לדוגמה הבאים מטבלה ב-BigQuery. נתוני המקור האלה הם על סרטים ועל המאפיינים שלהם.

לפני שתוכלו לייבא את הנתונים האלה אל Vertex AI Feature Store (גרסה קודמת), תצטרכו ליצור featurestore, שהוא מאגר ברמה העליונה לכל שאר המשאבים. במאגר התכונות, יוצרים סוגי ישויות שמקבצים ומכילים תכונות קשורות. לאחר מכן תוכלו ליצור תכונות שממופות לתכונות בנתוני המקור. השמות של סוג הישות והתכונות יכולים להיות זהים לשמות של כותרות העמודות, אבל זה לא חובה.
בדוגמה הזו, כותרת העמודה movie_id יכולה להיות ממופה לסוג ישות movie. average_rating, title ו-genre הם מאפיינים של סוג הישות movie. הערכים בכל עמודה ממופים למופעים ספציפיים של סוג ישות או מאפיינים, שנקראים ישויות וערכי מאפיינים.
בעמודה 'חותמת זמן' מצוין מתי נוצרו הערכים של התכונות. במאגר התכונות, חותמות הזמן הם מאפיין של ערכי התכונות, ולא סוג משאב נפרד. אם כל ערכי התכונות נוצרו באותו הזמן, לא צריך להוסיף עמודה של חותמת זמן. אפשר לציין את חותמת הזמן כחלק מבקשת הייבוא.
מאגר פיצ'רים
מאגר פיצ'רים הוא המאגר ברמה העליונה של סוגי ישויות, תכונות וערכי תכונות. בדרך כלל, ארגון יוצר מאגר פיצ'רים משותף אחד כדי לייבא, להציג ולשתף פיצ'רים בין כל הצוותים בארגון. עם זאת, לפעמים כדאי ליצור כמה מאגרי תכונות באותו פרויקט כדי לבודד סביבות. לדוגמה, יכול להיות שיש לכם מאגרי תכונות נפרדים לניסויים, לבדיקות ולייצור.
סוג ישות
סוג ישות הוא אוסף של תכונות שקשורות מבחינה סמנטית. אתם מגדירים את סוגי הישויות שלכם על סמך המושגים שרלוונטיים לתרחיש השימוש שלכם. לדוגמה, בשירות סרטים יכולים להיות סוגי הישויות movie ו-user, שמקבצים תכונות קשורות שמתאימות לסרטים או ללקוחות.
ישות
ישות היא מופע של סוג ישות. לדוגמה, movie_01 ו-movie_02 הן ישויות מסוג הישות movie. במאגר תכונות, לכל ישות צריך להיות מזהה ייחודי, והיא צריכה להיות מסוג STRING.
תכונה
תכונה היא מאפיין או תכונה מדידים של סוג ישות. לדוגמה,
לסוג הישות movie יש מאפיינים כמו average_rating ו-title שמאפשרים
לעקוב אחרי מאפיינים שונים של סרטים. התכונות משויכות לסוגי ישויות.
התכונות צריכות להיות שונות בתוך סוג ישות נתון, אבל הן לא צריכות להיות ייחודיות באופן גלובלי. לדוגמה, אם משתמשים ב-title עבור שני סוגים שונים של ישויות, Vertex AI Feature Store (Legacy) מפרש את title כשני מאפיינים שונים. כשקוראים ערכי מאפיינים, צריך לספק את המאפיין ואת סוג הישות שלו כחלק מהבקשה.
כשיוצרים תכונה, מציינים את סוג הערך שלה, כמו BOOL_ARRAY, DOUBLE, DOUBLE_ARRAY ו-STRING. הערך הזה קובע אילו סוגי ערכים אפשר לייבא לתכונה מסוימת. מידע נוסף על סוגי הערכים הנתמכים מופיע ב-valueType במאמר ההפניה ל-API.
ערך התכונה
Vertex AI Feature Store (גרסה קודמת) מתעד ערכי מאפיינים של מאפיין בנקודת זמן ספציפית. במילים אחרות, יכולים להיות כמה ערכים לישות ולתכונה נתונות. לדוגמה, לישות movie_01 יכולים להיות כמה ערכים של התכונה average_rating. הערך יכול להיות 4.4 בשלב מסוים ו-4.8 בשלב מאוחר יותר. Vertex AI Feature Store (Legacy) משייך טופל
מזהה לכל ערך של תכונה (entity_id, feature_id, timestamp),
שמשמש את Vertex AI Feature Store (Legacy) לחיפוש ערכים בזמן ההצגה.
Vertex AI Feature Store (Legacy) מאחסן ערכים נפרדים למרות שהזמן הוא רציף. כשמבקשים ערך של תכונה בזמן t, Vertex AI Feature Store (Legacy) מחזיר את הערך האחרון שמאוחסן בזמן t או לפניו. לדוגמה, אם ב-Vertex AI Feature Store (Legacy) מאוחסנים פרטי המיקום של מכונית בזמנים 100 ו-110, המיקום בזמן 100 משמש לבקשות בכל הזמנים שבין 100 (כולל) ל-110 (לא כולל). אם אתם צריכים רזולוציה גבוהה יותר, אתם יכולים, למשל, להסיק את המיקום בין הערכים או להגדיל את קצב הדגימה של הנתונים.
ייבוא תכונות
ייבוא תכונות הוא תהליך של ייבוא ערכי תכונות שמחושבים על ידי משימות הנדסת פיצ'רים (feature engineering) אל מאגר פיצ'רים. כדי לייבא נתונים, צריך להגדיר את סוג הישות והתכונות המתאימים במאגר התכונות. Vertex AI Feature Store (גרסה קודמת) מאפשר ייבוא של נתונים בכמות גדולה וייבוא של נתונים בזמן אמת, כך שתוכלו להוסיף ערכי מאפיינים בכמות גדולה או בזמן אמת.
לדוגמה, יכול להיות שיש לכם נתוני מקור מחושבים שמאוחסנים במיקומים כמו BigQuery או Cloud Storage. אתם יכולים לייבא נתונים בכמויות גדולות מהמקורות האלה למאגר פיצ'רים מרכזי, כדי שערכי התכונות האלה יוצגו בפורמט אחיד. כשהנתונים במקור משתנים, אפשר להשתמש בייבוא סטרימינג כדי להוסיף את השינויים האלה במהירות למאגר פיצ'רים. כך תוכלו לקבל את הנתונים העדכניים ביותר לתרחישי מילוי בקשה באופן מיידי.
מידע נוסף זמין במאמר בנושא ייבוא של ערכים בקבוצות או ייבוא בסטרימינג.
ייצוא מאפיינים
ייצוא מאפיינים הוא תהליך של ייצוא ערכים של תכונות מאוחסנות לצורך אימון או הסקה. Vertex AI Feature Store (גרסה קודמת) מציע שתי שיטות להצגת תכונות: באצווה ובאונליין. שליפת נתונים ב-batch מתאימה לתפוקה גבוהה ולהצגת נפחים גדולים של נתונים לעיבוד אופליין (למשל לאימון מודלים או לחיזוי ב-batch). מילוי בקשה באופן מיידי מיועד לאחזור נתונים בזמן אחזור קצר של אצוות קטנות של נתונים לעיבוד בזמן אמת (למשל, לחיזויים אונליין).
מידע נוסף זמין במאמרים בנושא הצגת מודעות אונליין או הצגת מודעות בקבוצות.
תצוגת ישות
כשמאחזרים ערכים ממאגר תכונות, השירות מחזיר תצוגת ישות שמכילה את ערכי התכונות שביקשתם. אפשר לחשוב על תצוגת ישות כהקרנה של התכונות והערכים ש-Vertex AI Feature Store (מאגר תכונות מדור קודם) מחזיר מבקשת שירות אונליין או בקשת שליפת נתונים ב-batch:
- עבור בקשות מילוי בקשה באופן מיידי, אפשר לקבל את כל התכונות או קבוצת משנה של תכונות עבור סוג ישות מסוים.
- בבקשות לשליפת נתונים ב-batch, אפשר לקבל את כל התכונות או קבוצת משנה של תכונות עבור סוג ישות אחד או יותר. לדוגמה, אם מאפיינים מפוזרים על פני כמה סוגי ישויות, אפשר לאחזר אותם יחד בבקשה אחת, וכך לשלב את המאפיינים האלה. אחר כך אפשר להשתמש בתוצאות כדי להזין אותן לבקשה של למידת מכונה או של חיזוי אצווה.
ייצוא נתונים
Vertex AI Feature Store (גרסה קודמת) מאפשר לכם לייצא נתונים ממאגרי התכונות כדי ליצור גיבויים ולשמור בארכיון את ערכי התכונות. אתם יכולים לייצא את הערכים האחרונים של התכונות (תמונת מצב) או טווח של ערכים (ייצוא מלא). למידע נוסף, ראו ייצוא ערכי תכונות.
המאמרים הבאים
- מידע על הגדרת הפרויקט ל-Vertex AI Feature Store (גרסה קודמת).
- מידע נוסף על הדרישות בנוגע לנתוני המקור