עיון ב-Knowledge Catalog

Knowledge Catalog (לשעבר Dataplex Universal Catalog) הוא פתרון לניהול נתונים שמבוסס-AI. הוא מספק לסוכנים הקשר נתונים באיכות גבוהה כדי לעגן תוכן שנוצר. בדף הזה מפורטים תרחישי שימוש מעשיים שיעזרו לכם להתחיל לעבוד עם Knowledge Catalog.

פיתוח סוכני AI והפעלתם

הפעלת שאילתות מורכבות בשפה טבעית על נכסי נתונים ארגוניים, באמצעות סוכן גילוי שמבצע קריאות ל-Knowledge Catalog API ‏ (Python).
ליצור סקירות כלליות מבוססות-AI של נכסי הנתונים שלכם בהיקף נרחב, באמצעות סוכן העשרה שמבצע קריאות ל-Knowledge Catalog API ‏ (Python).
מוודאים ש-Knowledge Catalog יכול להבחין בין נתוני המקור לבין נתונים נגזרים זמניים, באמצעות שאילתות בשפה טבעית ל-Gemini CLI שמחובר לשרת MCP מקומי.

הגדרת משילות מידע (data governance)

מגדירים אגם נתונים ריאליסטי ב-BigQuery, מיישמים תגי מטא נתונים (היבטים) כדי להבחין בין נתונים תקפים לבין רעשי רקע, ומשתמשים ב-Gemini CLI כדי לוודא שהמערכת פועלת לפי הכללים שהגדרתם.
אפשר לצרף נתונים מובְנים, מטא-נתונים מבוססי-סכמה (היבטים) והגדרות עסקיות (מילונים) לנכסי הנתונים (רשומות) באמצעות מסוף Google Cloud.
ליצור טבלאות Apache Iceberg, לאכוף מדיניות מרכזית של נתונים לאבטחה ברמת העמודה, להגדיר מדיניות אבטחה ולהציג באופן חזותי את שרשרת המקור של הנתונים.

ניתוח שושלת הנתונים

להבין איך טרנספורמציות של נתונים משפיעות על משאבים במורד הזרם, על תקינות הנתונים ועל תהליכי העבודה.
עוקבים אחרי זרימת המידע האישי הרגיש עד לתהליך שמעביר אותו ממיקום מהימן למיקום לא מהימן.
כדי לצמצם את עלויות האחסון, כדאי לזהות נכסים שלא נמצאים בשימוש פעיל כמקורות לתהליכים אחרים.

אוטומציה של איכות הנתונים באמצעות AI

באמצעות Gemini CLI, אפשר להשתמש בשאילתות בשפה טבעית כדי ליצור פרופיל של נתונים וליצור כללים לאיכות הנתונים, ואז לפרוס את הכללים האלה כסריקות אוטומטיות.