עיון ב-Knowledge Catalog
Knowledge Catalog (לשעבר Dataplex Universal Catalog) הוא פתרון לניהול נתונים שמבוסס-AI. הוא מספק לסוכנים הקשר נתונים באיכות גבוהה כדי לעגן תוכן שנוצר. בדף הזה מפורטים תרחישי שימוש מעשיים שיעזרו לכם להתחיל לעבוד עם Knowledge Catalog.
פיתוח סוכני AI והפעלתם
יצירת סוכן לחיפוש נתונים
הפעלת שאילתות מורכבות בשפה טבעית על נכסי נתונים ארגוניים, באמצעות סוכן גילוי שמבצע קריאות ל-Knowledge Catalog API (Python).
יצירת סוכן להעשרת מטא-נתונים
ליצור סקירות כלליות מבוססות-AI של נכסי הנתונים שלכם בהיקף נרחב, באמצעות סוכן העשרה שמבצע קריאות ל-Knowledge Catalog API (Python).
שימוש בסוכן Gemini CLI לבדיקת הקשר של הנתונים
מוודאים ש-Knowledge Catalog יכול להבחין בין נתוני המקור לבין נתונים נגזרים זמניים, באמצעות שאילתות בשפה טבעית ל-Gemini CLI שמחובר לשרת MCP מקומי.
הגדרת משילות מידע (data governance)
בניית תשתית לנתונים
מגדירים אגם נתונים ריאליסטי ב-BigQuery, מיישמים תגי מטא נתונים (היבטים) כדי להבחין בין נתונים תקפים לבין רעשי רקע, ומשתמשים ב-Gemini CLI כדי לוודא שהמערכת פועלת לפי הכללים שהגדרתם.
הגדרת הקשר של נתונים בסיסיים
אפשר לצרף נתונים מובְנים, מטא-נתונים מבוססי-סכמה (היבטים) והגדרות עסקיות (מילונים) לנכסי הנתונים (רשומות) באמצעות מסוף Google Cloud.
הפעלת גישה ל-lakehouse בהתאם למדיניות באמצעות Knowledge Catalog
ליצור טבלאות Apache Iceberg, לאכוף מדיניות מרכזית של נתונים לאבטחה ברמת העמודה, להגדיר מדיניות אבטחה ולהציג באופן חזותי את שרשרת המקור של הנתונים.
ניתוח שושלת הנתונים
ניתוח ההשפעה של שינויים בנתונים
להבין איך טרנספורמציות של נתונים משפיעות על משאבים במורד הזרם, על תקינות הנתונים ועל תהליכי העבודה.
ניתוח הסיבות לדליפת פרטים אישיים מזהים
עוקבים אחרי זרימת המידע האישי הרגיש עד לתהליך שמעביר אותו ממיקום מהימן למיקום לא מהימן.
אופטימיזציה של עלויות האחסון
כדי לצמצם את עלויות האחסון, כדאי לזהות נכסים שלא נמצאים בשימוש פעיל כמקורות לתהליכים אחרים.
אוטומציה של איכות הנתונים באמצעות AI
אוטומציה של סריקות איכות הנתונים
באמצעות Gemini CLI, אפשר להשתמש בשאילתות בשפה טבעית כדי ליצור פרופיל של נתונים וליצור כללים לאיכות הנתונים, ואז לפרוס את הכללים האלה כסריקות אוטומטיות.