Knowledge Graph לארגונים מארגן מידע מבודד (siloed) לידע ארגוני, שכולל איחוד, סטנדרטיזציה והתאמה של נתונים בצורה יעילה ושימושית.
Entity Reconciliation API
Entity Reconciliation API הוא שירות קל משקל מבוסס-AI לקיבוץ סמנטי ולביטול כפילויות של נתונים טבלאיים. זהו API עצמאי שעוטף את מנוע הרזולוציה של ישויות הליבה של Google. הוא עוזר ללקוחות להשוות ולצרף את הנתונים שלהם, או לצרף את הנתונים שלהם למערך נתונים אחד או יותר של צד שלישי.
בין התכונות העיקריות:
- מודל איכותי ומתקדם ביותר (SOTA) שאומן מראש עם הנתונים בחשבון Google.
- העשרה מובנית של ישויות, כולל גיאוקוד.
- אשכולות וגישור בקנה מידה של Google שמטפלים בגרף בגודל של עד מיליארדי צמתים וטריליוני קצוות.
- מזהה מכונה (MID) יציב הוא מזהה ייחודי לכל אחד מאשכולות הישויות.
- תמיכה מקורית בעד 10 טבלאות BigQuery.
איך זה עובד

במסדי נתונים רלציוניים, ההתאמה מתבצעת בעיקר באמצעות מפתחות שמנוהלים בקפידה, למשל מזהי לקוחות. חלק מהמערכות תומכות בהתאמה משוערת, למשל, "Robert Smith" לעומת "Bob Smith". בגרפים, ההתאמה מתבצעת באמצעות שילוב כלשהו של טקסט לא מדויק, קשרים נפוצים, סוגי ישויות והמאפיינים שלהן. השיטה הזו מתאימה במיוחד לאיחוד נתונים ממערכות שונות.
ממשק ה-API של Entity Reconciliation קורא נתונים מטבלאות מקור ב-BigQuery בהינתן קבוצה של סוגי ישויות וקבצים שממופים לסכימה משותפת. לאחר מכן, הוא מבצע חילוץ ידע כדי להפוך את נתוני הקלט הרלציוניים לשלישיות RDF, כמו ייצוג של תרשים ידע. לאחר מכן, מנוע התאמת הישויות של Google יוצר תרשים כדי לאגד ישויות לקבוצות שונות (ישויות באותה קבוצה נחשבות כהתאמה). השלב האחרון הוא להוציא את תוצאת הקישור (התאמה ואי-התאמה) לטבלאות BigQuery שצוינו על ידי הלקוח, בצורה של עמודה חדשה של מזהים ייחודיים (MID).
Google Knowledge Graph Search API
חיפוש לפי מילת מפתח או חיפוש ישויות באמצעות מזהה ב-Knowledge Graph של Google מתבצע באמצעות Knowledge Graph Search API של Google. ה-API משתמש בסוגים סטנדרטיים של schema.org ועומד בדרישות של מפרט JSON-LD.
אפשר להשתמש ב-API כדי:
- ביצוע רזולוציה של ישויות בארגון, במוצר, במיקום, בספר, בסרט ובעוד הרבה ישויות אחרות.
- מקשרים את הישות הפרטית ל-MID (מזהה מכונה) של Knowledge Graph בענן שהוא ייחודי באופן גלובלי.
- לקבל רשימה מדורגת של הישויות הבולטות ביותר שתואמות לקריטריונים מסוימים.
- הוספת הערות לתוכן וארגון שלו באמצעות ישויות של Knowledge Graph של Google.
- להתחבר למערכת אקולוגית רחבה יותר של נתונים באמצעות מזהים נוספים שמוחזרים על ידי Google Knowledge Graph Search API, כמו מזהה מקום ב-Google.
- חיפוש ישויות ממזהי MID שהוחזרו על ידי ממשקי API אחרים, כמו Cloud Vision API, Cloud Natural Language API ו-Cloud Video Intelligence API Google Cloud
מהדורות של Google Knowledge Graph Search API
Google Knowledge Graph Search API מציע שתי מהדורות:
BasicAdvanced
שתי המהדורות תומכות בחיפוש ובאיתור של ישויות. הם גם מציגים את אותן ישויות בסיסיות של Knowledge Graph שנבנו על ידי Google Cloud. מהדורת Enterprise כוללת תכונות נוספות כמו קישור למזהה מקום ב-Google וכיסוי נתונים נוסף.
אם אתם מתכננים פרויקט חדש, כדאי לבנות את האפליקציה באמצעות Cloud Knowledge Graph Advanced edition כדי ליהנות מהתכונות החדשות ומהשיפורים בשירות. מהדורת Basic עדיין זמינה, אבל היא לא תומכת בתכונות חדשות, ב-QPS גבוה או בתקני אבטחה ותאימות נוספים.
השוואה בין מהדורות Basic ו-Advanced