תחביר החיפוש ב-Dataplex Universal Catalog

במסמך הזה מוסבר על התחביר של חיפוש מילות מפתח ב-Dataplex Universal Catalog וגם על חיפושים בשפה טבעית באמצעות AI.

‫Dataplex Universal Catalog מאפשר לכם לגלות, לקטלג באופן מרכזי, לנהל ולהבין את הנתונים של הארגון. כדי למצוא ביעילות נכסי נתונים ספציפיים בקטלוג הנתונים, אפשר להשתמש בשאילתות חיפוש מתקדמות. התחביר של שאילתות חיפוש כולל:

  • חיפוש פשוט: איך מוצאים נכסי נתונים באמצעות מונח חיפוש יחיד.
  • פרדיקטים מתאימים: איך לצמצם את החיפוש באמצעות שדות ספציפיים של מטא-נתונים, כמו שם, מיקום או תיאור.
  • חיפוש לפי מאפיין: איך מחפשים רשומות על סמך המטא-נתונים העסקיים והטכניים שמצורפים אליהן.
  • אופרטורים לוגיים: איך משלבים כמה קריטריונים לחיפוש באמצעות AND ו-OR כדי ליצור שאילתות מורכבות. הבנת התחביר הזה מאפשרת לכם לאתר במהירות את הנתונים שאתם צריכים.

לפני שמתחילים

הסבר על רשומות, היבטים, סוגי היבטים, קבוצות רשומות וסוגי רשומות ב-Dataplex Universal Catalog. מידע נוסף זמין במאמר מידע על ניהול מטא-נתונים ב-Dataplex Universal Catalog.

ב-Dataplex Universal Catalog יש שני מצבי חיפוש: חיפוש מילות מפתח וחיפוש בשפה טבעית.

  • חיפוש מילות מפתח מאפשר לכם למצוא משאבים באמצעות מילות מפתח ספציפיות, מסננים ותחביר מוגדר.
  • חיפוש בשפה טבעית מתבסס על AI כדי להבין שאילתות סמנטיות. הוא מאפשר לכם למצוא משאבי AI באמצעות שפה יומיומית, בלי שתצטרכו להשתמש בתחביר מורכב.

במסמך הזה מוסבר על התחביר של חיפוש מילות מפתח וחיפוש בשפה טבעית. ‫AI כדי להפעיל שאילתת חיפוש ב-Dataplex Universal Catalog בGoogle Cloud מסוף, עוברים לדף Search ב-Dataplex Universal Catalog ובוחרים באפשרות Dataplex Universal Catalog כפלטפורמת החיפוש.

לחיפוש Google

מידע נוסף זמין במאמר בנושא חיפוש משאבים ב-Dataplex Universal Catalog.

כדי למצוא נכסים, אפשר להזין מונח או ביטוי בלי תחביר ספציפי. ‫Dataplex Universal Catalog מבצע חיפוש רחב על ידי התאמת השאילתה שלכם לכמה שדות מטא-נתונים, כולל:

  • שם, שם מוצג או תיאור של משאב
  • סוג המשאב
  • מזהה פרויקט
  • תיאור כללי
  • שם העמודה (או שם העמודה המקוננת) בסכימה של משאב
  • תיאור עמודה
  • שם מוגדר במלואו
  • אנשי קשר
  • היבטים

חיפוש באמצעות תחביר של שאילתות

כדי לבצע חיפושים מדויקים יותר, אפשר ליצור שאילתה באמצעות תחביר ספציפי, כולל מסננים, אופרטורים לוגיים וחיפושים של היבטים.

פסוקיות תנאי כשירות

אפשר להוסיף תנאי למאפיין על ידי הוספת מפתח לפניו שמגביל את ההתאמה לחלק ספציפי של מטא-נתונים:

  • סימן שווה (=) מגביל את החיפוש להתאמה מדויקת.
  • נקודתיים (:) אחרי המפתח מתאימות את התנאי למחרוזת משנה או לטוקן בתוך הערך בתוצאות החיפוש.

תהליך הטוקניזציה מפצל את זרם הטקסט לסדרה של טוקנים, כאשר כל טוקן בדרך כלל תואם למילה אחת.

לדוגמה:

  • name:foo בוחר משאבים עם שמות שמכילים את מחרוזת המשנה foo, כמו foo1 ו-barfoo.
  • description:foo בוחר משאבים עם הטוקן foo בתיאור, כמו bar ו-foo.
  • location=foo תואם למשאבים במיקום שצוין עם foo כשם המיקום.

ההתנהגות של המאפיינים הבולטים האלה משתנה מעט בין מצבי החיפוש, כפי שמפורט בקטעים הבאים.

מפתחות התנאי type,‏ system,‏ location ו-orgid תומכים רק במאפיין ההתאמה המדויקת (=), ולא במאפיין המחרוזת המשנית (:). לדוגמה, type=foo או orgid=number.

‫Dataplex Universal Catalog תומך במגדירי החיפוש הבאים לחיפוש מילות מפתח:

מגדיר תיאור
name:x המחרוזת x מופיעה כמחרוזת משנה במזהה המשאב.
displayname:x התאמה של x כמחרוזת משנה של השם המוצג של המשאב.
column:x המחרוזת x תואמת למחרוזת משנה של שם העמודה (או שם העמודה המקוננת) בסכימה של המשאב.
description:x התאמות x כטוקן בתיאור המשאב.
label:bar הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית מכיל את המחרוזת bar.
label=bar הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית שווה ל-bar כמחרוזת.
label:bar:x הערך x תואם למחרוזת משנה בערך של תווית עם מפתח bar שמצורפת למשאב BigQuery.
label=foo:bar הפונקציה מחזירה משאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar.
label.foo=bar הפונקציה מחזירה משאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar.
label.foo תואם למשאבי BigQuery שיש להם תווית שהמפתח שלה שווה ל-foo כמחרוזת.
type=TYPE התנאי תואם למשאבים מסוג רשומה ספציפי או לכינוי הסוג שלה.
projectid:bar המשאבים תואמים לפרויקטים ב- Google Cloud שתואמים ל-bar כמחרוזת משנה במזהה.
parent:x המחרוזת x תואמת למחרוזת משנה בנתיב ההיררכי של משאב. נתיב ההורה הוא fully_qualified_name של משאב ההורה.
orgid=number התאמה למשאבים בארגון Google Cloud עם ערך המזהה המדויק number.
system=SYSTEM התאמה למשאבים ממערכת שצוינה.
location=LOCATION

הפונקציה מחפשת משאבים במיקום שצוין עם שם מדויק. לדוגמה, location=us-central1 תואם לנכסים שמארחים באיווה.

נכסי BigQuery Omni תומכים במאפיין הזה באמצעות שם המיקום ב-BigQuery Omni. לדוגמה, ‫location=aws-us-east-1 תואם לנכסי BigQuery Omni בצפון וירג'יניה.

createtime

חיפוש משאבים שנוצרו בטווח תאריכים או זמנים מסוים, לפני או אחרי תאריך או שעה מסוימים.

לדוגמה:

  • createtime:2019-01-01 תואם למשאבים שנוצרו בתאריך 2019-01-01.
  • createtime<2019-02 matches resources created before 2019-02-01T00:00:00.
  • createtime>2019-02 מתאים למשאבים שנוצרו אחרי 2019-02-01T00:00:00.

הפורמט של חותמת הזמן: YYYY-MM-DDThh:mm:ss

כל חותמות הזמן צריכות להיות בפורמט GMT. אזורי זמן אינם נתמכים. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף (-) ובמפרידי תאריכים עם קו נטוי (/).

לדוגמה:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

חיפוש משאבים שעודכנו בטווח תאריכים או שעות מסוים, לפני או אחרי תאריך או שעה מסוימים.

לדוגמה:

  • updatetime:2019-01-01 matches resources updated on 2019-01-01.
  • updatetime<2019-02 matches resources updated before 2019-02-01T00:00:00.
  • updatetime>2019-02 matches resources updated after 2019-02-01T00:00:00.

הפורמט של חותמת הזמן: YYYY-MM-DDThh:mm:ss

כל חותמות הזמן צריכות להיות בפורמט GMT. אזורי זמן אינם נתמכים. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף (-) ובמפרידי תאריכים עם קו נטוי (/).

לדוגמה:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
fully_qualified_name:x המחרוזת x תואמת למחרוזת המשנה fully_qualified_name.
fully_qualified_name=x התאמות ל-x בתור fully_qualified_name.

מילות המפתח של התנאי type, system, location ו-description, וחיפוש מאפיינים (לא כולל has) תומכים רק במאפיין ההתאמה המדויקת (=), ולא במאפיין המחרוזת המשנית (:). לדוגמה, type=foo.

‫Dataplex Universal Catalog תומך במגדירי החיפוש הבאים בשפה טבעית:

מגדיר תיאור
name:x התאמה ל-x כמחרוזת משנה של מזהה המשאב או השם המוצג של המשאב.
displayname:x התאמה של x כמחרוזת משנה של השם המוצג של המשאב.
column:x המחרוזת x תואמת למחרוזת משנה של שם העמודה (או שם העמודה המקוננת) בסכימה של המשאב.
description:x התאמות x כטוקן בתיאור המשאב.
labels:bar הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית מכיל את המחרוזת bar.
labels=bar הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית שווה ל-bar כמחרוזת.
labels.bar:x הערך x תואם למחרוזת משנה בערך של תווית עם מפתח bar שמצורפת למשאב BigQuery.
labels.foo=bar הפונקציה מחזירה משאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar.
type=TYPE התנאי תואם למשאבים מסוג רשומה ספציפי או לכינוי הסוג שלה.
projectid:bar המשאבים תואמים לפרויקטים ב- Google Cloud שתואמים ל-bar כמחרוזת משנה במזהה.
parent:x המחרוזת x תואמת למחרוזת משנה בנתיב ההיררכי של משאב.
system=SYSTEM התאמה למשאבים ממערכת שצוינה.
location=LOCATION

הפונקציה מחפשת משאבים במיקום שצוין עם שם מדויק. לדוגמה, location=us-central1 תואם לנכסים שמארחים באיווה.

נכסי BigQuery Omni תומכים במאפיין הזה באמצעות שם המיקום ב-BigQuery Omni. לדוגמה, ‫location=aws-us-east-1 תואם לנכסי BigQuery Omni בצפון וירג'יניה.

createtime

חיפוש משאבים שנוצרו בטווח תאריכים או זמנים מסוים, לפני או אחרי תאריך או שעה מסוימים.

לדוגמה:

  • createtime:2019-01-01 מתאים לכל המשאבים שנוצרו בתאריך 2019-01-01.
  • createtime<2019-02 matches all resources created before 2019-02-01T00:00:00.
  • createtime>2019-02 מתאים לכל המשאבים שנוצרו אחרי 2019-02-01T00:00:00.
  • createtime>-30d תואם לכל המשאבים שנוצרו ב-30 הימים האחרונים.
  • createtime<=-30d תואם לכל המשאבים שנוצרו לפני 30 ימים או יותר.
  • createtime<=-1d matches all resources created on the previous day.

הפורמט של חותמת הזמן: YYYY-MM-DDThh:mm:ss

כל חותמות הזמן צריכות להיות בפורמט GMT. אזורי זמן אינם נתמכים. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף (-) ובמפרידי תאריכים עם קו נטוי (/).

לדוגמה:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22
updatetime

חיפוש משאבים שעודכנו בטווח תאריכים או שעות מסוים, לפני או אחרי תאריך או שעה מסוימים.

לדוגמה:

  • updatetime:2019-01-01 תואם לכל המשאבים שעודכנו ב-1 בינואר 2019.
  • updatetime<2019-02 matches all resources updated before 2019-02-01T00:00:00.
  • updatetime>2019-02 matches all resources updated after 2019-02-01T00:00:00.
  • updatetime>-30d תואם לכל המשאבים שעודכנו ב-30 הימים האחרונים.
  • updatetime<-30d matches all resources updated 30 days ago or earlier.
  • updatetime=-1d matches all resources updated on the previous day.
  • updatetime>=-30d תואם לכל המשאבים שעודכנו ב-30 הימים האחרונים.
  • updatetime<=-30d matches all resources updated 30 days ago or earlier.

הפורמט של חותמת הזמן: YYYY-MM-DDThh:mm:ss

כל חותמות הזמן צריכות להיות בפורמט GMT. אזורי זמן אינם נתמכים. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף (-) ובמפרידי תאריכים עם קו נטוי (/).

לדוגמה:

  • 2010-10-22T05:36:24
  • 2010-10-22T05:36
  • 2010-10-22T05
  • 2010-10-22
  • 2010-10
  • 2010
  • 2010/10/22

כדי לחפש רשומות לפי ההיבטים שמצורפים אליהן, משתמשים בתחביר השאילתה הבא.

חיפוש באמצעות מילות מפתח

מגדיר תיאור
aspect:x המחרוזת x תואמת למחרוזת משנה של הנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID
aspect=x התאמה ל-x כנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID
aspect:xOPERATORvalue

חיפוש ערכים בשדה המאפיין. התאמה ל-x כמחרוזת משנה של הנתיב המלא לסוג ההיבט ולשם השדה של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID.FIELD_NAME

רשימת האופרטורים הנתמכים תלויה בסוג השדה בהיבט, באופן הבא:

  • מחרוזת: = (התאמה מדויקת) ו-: (מחרוזת משנה)
  • כל סוגי המספרים: =, ‏:, <, ‏>, ‏<=, >=, ‏=>, ‏=<
  • Enum: =
  • Datetime: כמו במספרים, אבל הערכים להשוואה נחשבים לתאריכים ושעות במקום למספרים
  • בוליאני: =

אפשר לחפש רק בשדות ברמה העליונה של ההיבט.

לדוגמה, כל השאילתות הבאות תואמות לרשומות שבהן הערך של השדה is-enrolled בהיבט employee-info הוא true. יוחזרו גם רשומות אחרות שתואמות למחרוזת המשנה.

  • aspect:example-project.us-central1.employee-info.is-enrolled=true
  • aspect:example-project.us-central1.employee=true
  • aspect:employee=true

חיפוש בשפה טבעית

מגדיר תיאור
has:x המחרוזת x תואמת למחרוזת משנה של הנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID
has=x התאמה ל-x כנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID
xOPERATORvalue

חיפוש ערכים בשדה המאפיין. התאמה ל-x כמחרוזת משנה של הנתיב המלא לסוג ההיבט ולשם השדה של היבט שמצורף לרשומה, בפורמטים הבאים:

  • התחביר של סוגי היבטים של המערכת:

    • ASPECT_TYPE_ID.FIELD_NAME
    • dataplex-types.ASPECT_TYPE_ID.FIELD_NAME
    • dataplex-types.LOCATION.ASPECT_TYPE_ID.FIELD_NAME

    לדוגמה, השאילתות הבאות תואמות לרשומות שבהן הערך של השדה type בהיבט bigquery-dataset הוא default:

    • bigquery-dataset.type=default
    • dataplex-types.bigquery-dataset.type=default
    • dataplex-types.global.bigquery-dataset.type=default
  • תחביר לסוגי היבטים מותאמים אישית:

    • אם ההיבט נוצר באזור הגלובלי: PROJECT_ID.ASPECT_TYPE_ID.FIELD_NAME
    • אם ההיבט נוצר באזור ספציפי: PROJECT_ID.REGION.ASPECT_TYPE_ID.FIELD_NAME

    לדוגמה, השאילתות הבאות מתאימות לרשומות שבהן הערך של השדה is-enrolled בהיבט employee-info הוא true.

    • example-project.us-central1.employee-info.is-enrolled=true
    • example-project.employee-info.is-enrolled=true

    רשימת האופרטורים הנתמכים תלויה בסוג השדה בהיבט, באופן הבא:

    • מחרוזת: = (התאמה מדויקת)
    • כל סוגי המספרים: =, ‏:, <, ‏>, ‏<=, >=, ‏=>, ‏=<
    • Enum: =
    • Datetime: כמו במספרים, אבל הערכים להשוואה נחשבים לתאריכים ושעות במקום למספרים
    • בוליאני: =

אפשר לחפש רק בשדות ברמה העליונה של ההיבט.

אופרטורים לוגיים

שאילתה יכולה לכלול כמה פרדיקטים עם אופרטורים לוגיים. אם לא מציינים אופרטור, ברירת המחדל היא האופרטור הלוגי AND. לדוגמה, הפקודה foo bar מחזירה משאבים שתואמים גם לפרדיקט foo וגם לפרדיקט bar.

יש תמיכה באופרטורים לוגיים AND ולוגיים OR. לדוגמה, foo OR bar.

אפשר לשלול פסוקית באמצעות הקידומת - (מקף) או NOT. לדוגמה, הפונקציה -name:foo מחזירה משאבים עם שמות שלא תואמים לפרדיקט foo.

תחביר מקוצר

יש גם תחביר מקוצר לחיפוש, שבו משתמשים ב-| (קו אנכי) לאופרטורים OR וב-, (פסיק) לאופרטורים AND.

לדוגמה, כדי לחפש רשומות באחד מתוך כמה פרויקטים באמצעות האופרטור OR, אפשר להשתמש בתחביר המקוצר הבא:

projectid:(id1|id2|id3|id4)

אותו חיפוש ללא שימוש בתחביר מקוצר נראה כך:

projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4

כדי לחפש רשומות עם שמות עמודות תואמים, משתמשים ב:

  • AND: column:(name1,name2,name3)
  • OR: column:(name1|name2|name3)

התחביר המקוצר הזה פועל עבור הפרדיקטים המוסמכים, למעט label בחיפוש מילות מפתח.

המאמרים הבאים