תחביר החיפוש ב-Knowledge Catalog

במסמך הזה מוסבר על התחביר של חיפוש מילות מפתח ב-Knowledge Catalog (לשעבר Dataplex Universal Catalog) ושל חיפושי AI בשפה טבעית.

בעזרת Knowledge Catalog תוכלו לגלות את הנתונים של הארגון, לקטלג אותם באופן מרכזי, לנהל אותם ולהבין אותם. כדי למצוא ביעילות נכסי נתונים ספציפיים ב-Data Catalog, אפשר להשתמש בשאילתות חיפוש מתקדמות. התחביר של שאילתות חיפוש כולל:

  • חיפוש פשוט: איך מוצאים נכסי נתונים באמצעות מונח חיפוש יחיד.
  • פרדיקטים מתאימים: איך לחדד את החיפוש באמצעות שדות ספציפיים של מטא-נתונים, כמו שם, מיקום או תיאור.
  • חיפוש לפי מאפיין: איך לחפש רשומות על סמך המטא-נתונים העסקיים והטכניים שמצורפים אליהן.
  • אופרטורים לוגיים: איך משלבים כמה קריטריונים לחיפוש באמצעות AND ו-OR כדי ליצור שאילתות מורכבות. הבנת התחביר הזה מאפשרת לכם לאתר במהירות את הנתונים שאתם צריכים.

לפני שמתחילים

הסבר על קבוצות של רשומות, רשומות, קישורים לרשומות, היבטים, סוגי רשומות, סוגי קישורים לרשומות וסוגי היבטים ב-Knowledge Catalog. מידע נוסף על ניהול מטא-נתונים ב-Knowledge Catalog

Knowledge Catalog מציע שני מצבי חיפוש: חיפוש לפי מילות מפתח וחיפוש בשפה טבעית.

  • חיפוש מילות מפתח מאפשר לכם למצוא מקורות מידע באמצעות מילות מפתח ספציפיות, מסננים ותחביר מוגדר.
  • חיפוש בשפה טבעית משתמש ב-AI כדי להבין שאילתות של חיפוש סמנטי. הוא מאפשר לכם למצוא משאבים באמצעות שפה יומיומית, בלי שתצטרכו להשתמש בתחביר מורכב.

במסמך הזה מוסבר על התחביר של חיפוש מילות מפתח וחיפוש בשפה טבעית.

כדי להריץ שאילתת חיפוש ב-Knowledge Catalog בGoogle Cloud מסוף, עוברים לדף חיפוש ב-Knowledge Catalog ובוחרים באפשרות Knowledge Catalog כפלטפורמת החיפוש.

מעבר אל חיפוש

מידע נוסף זמין במאמר חיפוש משאבים ב-Knowledge Catalog.

אתם יכולים למצוא נכסים על ידי הזנת מונח או ביטוי ללא תחביר ספציפי. Knowledge Catalog מבצע חיפוש רחב על ידי התאמת השאילתה שלכם לכמה שדות של מטא-נתונים, כולל:

  • שם, שם מוצג או תיאור של משאב
  • סוג המשאב
  • מזהה פרויקט
  • תיאור כללי
  • שם העמודה (או שם העמודה המקוננת) בסכימה של משאב
  • תיאור עמודה
  • שם מוגדר במלואו
  • אנשי קשר
  • היבטים

חיפוש באמצעות תחביר של שאילתות

כדי לבצע חיפושים מדויקים יותר, אפשר ליצור שאילתה באמצעות תחביר ספציפי, כולל מסננים, אופרטורים לוגיים וחיפושים של היבטים.

פסוקיות תנאי כשירות

אפשר להוסיף תנאי למאפיין על ידי הוספת מפתח לפניו שמגביל את ההתאמה לקטע ספציפי של מטא-נתונים:

  • סימן שווה (=) מגביל את החיפוש להתאמה מדויקת.
  • נקודתיים (:) אחרי המפתח מתאימות את התנאי למחרוזת משנה או לטוקן בתוך הערך בתוצאות החיפוש.

תהליך הטוקניזציה מפצל את זרם הטקסט לסדרה של טוקנים, כאשר כל טוקן בדרך כלל תואם למילה אחת.

לדוגמה:

  • name:foo בוחר משאבים עם שמות שמכילים את מחרוזת המשנה foo, כמו ‫foo1 ו-barfoo.
  • description:foo בוחר משאבים עם הטוקן foo בתיאור, כמו bar ו-foo.
  • location=foo תואם למקורות במיקום שצוין עם foo כשם המיקום.

ההתנהגות של המאפיינים הבולטים האלה עשויה להשתנות מעט בין מצבי החיפוש, כפי שמפורט בקטעים הבאים.

מפתחות התנאי type, system, location ו-orgid תומכים רק במאפיין ההתאמה המדויקת (=), ולא במאפיין המחרוזת המשנית (:). לדוגמה, type=foo או orgid=number.

Knowledge Catalog תומך במגדירי החיפוש הבאים לחיפוש מילות מפתח:

מגדיר תיאור
name:x המחרוזת x מופיעה כמחרוזת משנה במזהה המשאב.
displayname:x התאמה של x כמחרוזת משנה של השם המוצג של המשאב.
column:x המחרוזת x תואמת למחרוזת משנה של שם העמודה (או של שם עמודה מקוננת) בסכימה של המשאב.
description:x התאמות x כטוקן בתיאור המשאב.
label:bar הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית מכיל את המחרוזת bar.
label=bar הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית שווה ל-bar כמחרוזת.
label:bar:x המחרוזת x תואמת למחרוזת משנה בערך של תווית עם מפתח bar שמצורפת למשאב BigQuery.
label=foo:bar התנאי תואם למשאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar.
label.foo=bar התנאי תואם למשאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar.
label.foo תואם למשאבי BigQuery שיש להם תווית שהמפתח שלה שווה ל-foo כמחרוזת.
type=TYPE התאמה למשאבים מסוג רשומה ספציפי או לכינוי הסוג שלה.
projectid:bar התאמה למשאבים בפרויקטים של Google Cloud שתואמים ל-bar כמחרוזת משנה במזהה.
parent:x תואם ל-x כמחרוזת משנה של הנתיב ההיררכי של משאב. נתיב ההורה הוא fully_qualified_name של משאב ההורה.
orgid=number התאמה למשאבים בארגון Google Cloud עם ערך המזהה המדויק number.
system=SYSTEM התאמה של משאבים ממערכת שצוינה.
location=LOCATION

הפונקציה מחפשת משאבים במיקום שצוין עם שם מדויק. לדוגמה, location=us-central1 תואם לנכסים שמארחים באיווה.

נכסי BigQuery Omni תומכים במאפיין הזה באמצעות שם המיקום של BigQuery Omni. לדוגמה, ‫location=aws-us-east-1 תואם לנכסי BigQuery Omni בצפון וירג'יניה.

createtime

חיפוש משאבים שנוצרו בטווח תאריכים או שעות מסוים, לפני או אחרי תאריך או שעה מסוימים.

לדוגמה:

  • createtime:2019-01-01 תואם למשאבים שנוצרו בתאריך 2019-01-01.
  • createtime<2019-02 matches resources created before 2019-02-01T00:00:00.
  • createtime>2019-02 מתאים למשאבים שנוצרו אחרי 2019-02-01T00:00:00.

הפורמט של חותמת הזמן: YYYY-MM-DDThh:mm:ss

כל חותמות הזמן צריכות להיות בפורמט GMT. אין תמיכה באזורי זמן. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף (-) ובמפרידי תאריכים עם לוכסן (/).

לדוגמה:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

חיפוש משאבים שעודכנו בטווח תאריכים או שעות מסוים, לפני או אחרי תאריך או שעה מסוימים.

לדוגמה:

  • updatetime:2019-01-01 matches resources updated on 2019-01-01.
  • updatetime<2019-02 matches resources updated before 2019-02-01T00:00:00.
  • updatetime>2019-02 matches resources updated after 2019-02-01T00:00:00.

הפורמט של חותמת הזמן: YYYY-MM-DDThh:mm:ss

כל חותמות הזמן צריכות להיות בפורמט GMT. אין תמיכה באזורי זמן. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף (-) ובמפרידי תאריכים עם לוכסן (/).

לדוגמה:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
fully_qualified_name:x המחרוזת x תואמת למחרוזת משנה של fully_qualified_name.
fully_qualified_name=x התאמות x בתור fully_qualified_name.

מילות המפתח של התנאי type, system, location ו-description, וחיפוש לפי מאפיין (לא כולל has) תומכים רק במאפיין ההתאמה המדויקת (=), ולא במאפיין המחרוזת המשנית (:). לדוגמה, type=foo.

‫Knowledge Catalog תומך במגדירי החיפוש הבאים בשפה טבעית:

מגדיר תיאור
name:x התאמה ל-x כמחרוזת משנה של מזהה המשאב או השם המוצג של המשאב.
displayname:x התאמה של x כמחרוזת משנה של השם המוצג של המשאב.
column:x המחרוזת x תואמת למחרוזת משנה של שם העמודה (או של שם עמודה מקוננת) בסכימה של המשאב.
description:x התאמות x כטוקן בתיאור המשאב.
labels:bar הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית מכיל את המחרוזת bar.
labels=bar הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית שווה ל-bar כמחרוזת.
labels.bar:x המחרוזת x תואמת למחרוזת משנה בערך של תווית עם מפתח bar שמצורפת למשאב BigQuery.
labels.foo=bar התנאי תואם למשאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar.
type=TYPE התאמה למשאבים מסוג רשומה ספציפי או לכינוי הסוג שלה.
projectid:bar התאמה למשאבים בפרויקטים של Google Cloud שתואמים ל-bar כמחרוזת משנה במזהה.
parent:x תואם ל-x כמחרוזת משנה של הנתיב ההיררכי של משאב.
system=SYSTEM התאמה של משאבים ממערכת שצוינה.
location=LOCATION

הפונקציה מחפשת משאבים במיקום שצוין עם שם מדויק. לדוגמה, location=us-central1 תואם לנכסים שמארחים באיווה.

נכסי BigQuery Omni תומכים במאפיין הזה באמצעות שם המיקום של BigQuery Omni. לדוגמה, ‫location=aws-us-east-1 תואם לנכסי BigQuery Omni בצפון וירג'יניה.

createtime

חיפוש משאבים שנוצרו בטווח תאריכים או שעות מסוים, לפני או אחרי תאריך או שעה מסוימים.

לדוגמה:

  • createtime:2019-01-01 מתאים לכל המשאבים שנוצרו בתאריך 2019-01-01.
  • createtime<2019-02 matches all resources created before 2019-02-01T00:00:00.
  • createtime>2019-02 תואם לכל המשאבים שנוצרו אחרי 2019-02-01T00:00:00.
  • createtime>-30d מתאים לכל המשאבים שנוצרו ב-30 הימים האחרונים.
  • createtime<=-30d תואם לכל המשאבים שנוצרו לפני 30 ימים או יותר.
  • createtime<=-1d תואם לכל המשאבים שנוצרו ביום הקודם.

הפורמט של חותמת הזמן: YYYY-MM-DDThh:mm:ss

כל חותמות הזמן צריכות להיות בפורמט GMT. אין תמיכה באזורי זמן. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף (-) ובמפרידי תאריכים עם לוכסן (/).

לדוגמה:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

חיפוש משאבים שעודכנו בטווח תאריכים או שעות מסוים, לפני או אחרי תאריך או שעה מסוימים.

לדוגמה:

  • updatetime:2019-01-01 תואם לכל המשאבים שעודכנו ב-1 בינואר 2019.
  • updatetime<2019-02 matches all resources updated before 2019-02-01T00:00:00.
  • updatetime>2019-02 matches all resources updated after 2019-02-01T00:00:00.
  • updatetime>-30d תואם לכל המשאבים שעודכנו ב-30 הימים האחרונים.
  • updatetime<-30d matches all resources updated 30 days ago or earlier.
  • updatetime=-1d matches all resources updated on the previous day.
  • updatetime>=-30d תואם לכל המשאבים שעודכנו ב-30 הימים האחרונים.
  • updatetime<=-30d matches all resources updated 30 days ago or earlier.

הפורמט של חותמת הזמן: YYYY-MM-DDThh:mm:ss

כל חותמות הזמן צריכות להיות בפורמט GMT. אין תמיכה באזורי זמן. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף (-) ובמפרידי תאריכים עם לוכסן (/).

לדוגמה:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22

כדי לחפש רשומות לפי ההיבטים שמצורפים אליהן, משתמשים בתחביר השאילתה הבא.

חיפוש באמצעות מילות מפתח

מגדיר תיאור
aspect:x המחרוזת x מופיעה כמחרוזת משנה בנתיב המלא של סוג ההיבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID
aspect=x התאמה ל-x כנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID
aspect:xOPERATORvalue

חיפוש ערכים של שדות מאפיינים. התאמה ל-x כמחרוזת משנה של הנתיב המלא לסוג ההיבט ולשם השדה של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID.FIELD_NAME

רשימת האופרטורים הנתמכים תלויה בסוג השדה בהיבט, באופן הבא:

  • מחרוזת: = (התאמה מדויקת) ו-: (מחרוזת משנה)
  • כל סוגי המספרים: =, :, <, >, <=, >=, =>, =<
  • Enum: =
  • Datetime: כמו במספרים, אבל הערכים להשוואה נחשבים לתאריכים ושעות במקום למספרים
  • בוליאני: =

אפשר לחפש רק בשדות ברמה העליונה של ההיבט.

לדוגמה, כל השאילתות הבאות תואמות לרשומות שבהן הערך של השדה is-enrolled בהיבט employee-info הוא true. יוחזרו גם רשומות אחרות שתואמות למחרוזת המשנה.

  • aspect:example-project.us-central1.employee-info.is-enrolled=true
  • aspect:example-project.us-central1.employee=true
  • aspect:employee=true

חיפוש בשפה טבעית

מגדיר תיאור
aspect:x
או
has:x
המחרוזת x מופיעה כמחרוזת משנה בנתיב המלא של סוג ההיבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID
aspect=x
או
has=x
התאמה ל-x כנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID
xOPERATORvalue

חיפוש ערכים של שדות מאפיינים. התאמה ל-x כמחרוזת משנה של הנתיב המלא לסוג ההיבט ולשם השדה של היבט שמצורף לרשומה, בפורמטים הבאים:

  • התחביר של סוגי היבטים של המערכת:

    • ASPECT_TYPE_ID.FIELD_NAME
    • dataplex-types.ASPECT_TYPE_ID.FIELD_NAME
    • dataplex-types.LOCATION.ASPECT_TYPE_ID.FIELD_NAME

    לדוגמה, השאילתות הבאות מתאימות לרשומות שבהן הערך של השדה type בהיבט bigquery-dataset הוא default:

    • bigquery-dataset.type=default
    • dataplex-types.bigquery-dataset.type=default
    • dataplex-types.global.bigquery-dataset.type=default
  • תחביר לסוגי היבטים מותאמים אישית:

    • אם ההיבט נוצר באזור הגלובלי: PROJECT_ID.ASPECT_TYPE_ID.FIELD_NAME
    • אם ההיבט נוצר באזור ספציפי: PROJECT_ID.REGION.ASPECT_TYPE_ID.FIELD_NAME

    לדוגמה, השאילתות הבאות מתאימות לרשומות שבהן הערך של השדה is-enrolled בהיבט employee-info הוא true.

    • example-project.us-central1.employee-info.is-enrolled=true
    • example-project.employee-info.is-enrolled=true

    רשימת האופרטורים הנתמכים תלויה בסוג השדה בהיבט, באופן הבא:

    • מחרוזת: = (התאמה מדויקת)
    • כל סוגי המספרים: =, :, <, >, <=, >=, =>, =<
    • Enum: =
    • Datetime: כמו במספרים, אבל הערכים להשוואה נחשבים לתאריכים ושעות במקום למספרים
    • בוליאני: =

אפשר לחפש רק בשדות ברמה העליונה של ההיבט.

אופרטורים לוגיים

שאילתה יכולה לכלול כמה פרדיקטים עם אופרטורים לוגיים. אם לא מציינים אופרטור, האופרטור הלוגי AND מוגדר כברירת מחדל. לדוגמה, הפקודה foo bar מחזירה משאבים שתואמים גם לפרדיקט foo וגם לפרדיקט bar.

יש תמיכה באופרטורים לוגיים AND ולוגיים OR. לדוגמה, foo OR bar.

אפשר לשלול פסוקית באמצעות הקידומת - (מקף) או NOT. לדוגמה, הפונקציה -name:foo מחזירה משאבים עם שמות שלא תואמים לפרדיקט foo.

תחביר מקוצר

אפשר גם להשתמש בתחביר מקוצר לחיפוש, עם | (קו אנכי) לאופרטורים OR ועם , (פסיק) לאופרטורים AND.

לדוגמה, כדי לחפש רשומות באחד מתוך כמה פרויקטים באמצעות האופרטור OR, אפשר להשתמש בתחביר המקוצר הבא:

projectid:(id1|id2|id3|id4)

אותו חיפוש ללא שימוש בתחביר מקוצר נראה כך:

projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4

כדי לחפש רשומות עם שמות עמודות תואמים, משתמשים ב:

  • AND: column:(name1,name2,name3)
  • OR: column:(name1|name2|name3)

התחביר המקוצר הזה פועל עבור הפרדיקטים המוסמכים, למעט label בחיפוש מילות מפתח.

המאמרים הבאים