במסמך הזה מוסבר על התחביר של חיפוש מילות מפתח ב-Dataplex Universal Catalog וגם על חיפושים בשפה טבעית באמצעות AI.
Dataplex Universal Catalog מאפשר לכם לגלות, לקטלג באופן מרכזי, לנהל ולהבין את הנתונים של הארגון. כדי למצוא ביעילות נכסי נתונים ספציפיים בקטלוג הנתונים, אפשר להשתמש בשאילתות חיפוש מתקדמות. התחביר של שאילתות חיפוש כולל:
- חיפוש פשוט: איך מוצאים נכסי נתונים באמצעות מונח חיפוש יחיד.
- פרדיקטים מתאימים: איך לצמצם את החיפוש באמצעות שדות ספציפיים של מטא-נתונים, כמו שם, מיקום או תיאור.
- חיפוש לפי מאפיין: איך מחפשים רשומות על סמך המטא-נתונים העסקיים והטכניים שמצורפים אליהן.
- אופרטורים לוגיים: איך משלבים כמה קריטריונים לחיפוש באמצעות AND ו-OR כדי ליצור שאילתות מורכבות. הבנת התחביר הזה מאפשרת לכם לאתר במהירות את הנתונים שאתם צריכים.
לפני שמתחילים
הסבר על רשומות, היבטים, סוגי היבטים, קבוצות רשומות וסוגי רשומות ב-Dataplex Universal Catalog. מידע נוסף זמין במאמר מידע על ניהול מטא-נתונים ב-Dataplex Universal Catalog.
ב-Dataplex Universal Catalog יש שני מצבי חיפוש: חיפוש מילות מפתח וחיפוש בשפה טבעית.
- חיפוש מילות מפתח מאפשר לכם למצוא משאבים באמצעות מילות מפתח ספציפיות, מסננים ותחביר מוגדר.
- חיפוש בשפה טבעית מתבסס על AI כדי להבין שאילתות סמנטיות. הוא מאפשר לכם למצוא משאבי AI באמצעות שפה יומיומית, בלי שתצטרכו להשתמש בתחביר מורכב.
במסמך הזה מוסבר על התחביר של חיפוש מילות מפתח וחיפוש בשפה טבעית. AI כדי להפעיל שאילתת חיפוש ב-Dataplex Universal Catalog בGoogle Cloud מסוף, עוברים לדף Search ב-Dataplex Universal Catalog ובוחרים באפשרות Dataplex Universal Catalog כפלטפורמת החיפוש.
מידע נוסף זמין במאמר בנושא חיפוש משאבים ב-Dataplex Universal Catalog.
חיפוש טקסט חופשי
כדי למצוא נכסים, אפשר להזין מונח או ביטוי בלי תחביר ספציפי. Dataplex Universal Catalog מבצע חיפוש רחב על ידי התאמת השאילתה שלכם לכמה שדות מטא-נתונים, כולל:
- שם, שם מוצג או תיאור של משאב
- סוג המשאב
- מזהה פרויקט
- תיאור כללי
- שם העמודה (או שם העמודה המקוננת) בסכימה של משאב
- תיאור עמודה
- שם מוגדר במלואו
- אנשי קשר
- היבטים
חיפוש באמצעות תחביר של שאילתות
כדי לבצע חיפושים מדויקים יותר, אפשר ליצור שאילתה באמצעות תחביר ספציפי, כולל מסננים, אופרטורים לוגיים וחיפושים של היבטים.
פסוקיות תנאי כשירות
אפשר להוסיף תנאי למאפיין על ידי הוספת מפתח לפניו שמגביל את ההתאמה לחלק ספציפי של מטא-נתונים:
- סימן שווה (
=) מגביל את החיפוש להתאמה מדויקת. - נקודתיים (
:) אחרי המפתח מתאימות את התנאי למחרוזת משנה או לטוקן בתוך הערך בתוצאות החיפוש.
תהליך הטוקניזציה מפצל את זרם הטקסט לסדרה של טוקנים, כאשר כל טוקן בדרך כלל תואם למילה אחת.
לדוגמה:
-
name:fooבוחר משאבים עם שמות שמכילים את מחרוזת המשנהfoo, כמוfoo1ו-barfoo. -
description:fooבוחר משאבים עם הטוקןfooבתיאור, כמוbarו-foo. -
location=fooתואם למשאבים במיקום שצוין עםfooכשם המיקום.
ההתנהגות של המאפיינים הבולטים האלה משתנה מעט בין מצבי החיפוש, כפי שמפורט בקטעים הבאים.
חיפוש באמצעות מילות מפתח
מפתחות התנאי type, system, location ו-orgid תומכים רק במאפיין ההתאמה המדויקת (=), ולא במאפיין המחרוזת המשנית (:). לדוגמה, type=foo או orgid=number.
Dataplex Universal Catalog תומך במגדירי החיפוש הבאים לחיפוש מילות מפתח:
| מגדיר | תיאור |
|---|---|
name:x |
המחרוזת x מופיעה כמחרוזת משנה במזהה המשאב. |
displayname:x |
התאמה של x כמחרוזת משנה של השם המוצג של המשאב. |
column:x |
המחרוזת x תואמת למחרוזת משנה של שם העמודה (או שם העמודה המקוננת) בסכימה של המשאב. |
description:x |
התאמות x כטוקן בתיאור המשאב. |
label:bar |
הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית מכיל את המחרוזת bar. |
label=bar |
הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית שווה ל-bar כמחרוזת. |
label:bar:x |
הערך x תואם למחרוזת משנה בערך של תווית עם מפתח bar שמצורפת למשאב BigQuery. |
label=foo:bar |
הפונקציה מחזירה משאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar. |
label.foo=bar |
הפונקציה מחזירה משאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar. |
label.foo |
תואם למשאבי BigQuery שיש להם תווית שהמפתח שלה שווה ל-foo כמחרוזת. |
type=TYPE |
התנאי תואם למשאבים מסוג רשומה ספציפי או לכינוי הסוג שלה. |
projectid:bar |
המשאבים תואמים לפרויקטים ב- Google Cloud שתואמים ל-bar כמחרוזת משנה במזהה. |
parent:x |
המחרוזת x תואמת למחרוזת משנה בנתיב ההיררכי של משאב. נתיב ההורה הוא fully_qualified_name של משאב ההורה. |
orgid=number |
התאמה למשאבים בארגון Google Cloud עם ערך המזהה המדויק number. |
system=SYSTEM |
התאמה למשאבים ממערכת שצוינה. |
location=LOCATION |
הפונקציה מחפשת משאבים במיקום שצוין עם שם מדויק.
לדוגמה, נכסי BigQuery Omni תומכים במאפיין הזה באמצעות שם המיקום ב-BigQuery Omni.
לדוגמה,
|
createtime |
חיפוש משאבים שנוצרו בטווח תאריכים או זמנים מסוים, לפני או אחרי תאריך או שעה מסוימים. לדוגמה:
הפורמט של חותמת הזמן: כל חותמות הזמן צריכות להיות בפורמט GMT. אזורי זמן אינם נתמכים. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף ( לדוגמה:
|
updatetime |
חיפוש משאבים שעודכנו בטווח תאריכים או שעות מסוים, לפני או אחרי תאריך או שעה מסוימים. לדוגמה:
הפורמט של חותמת הזמן: כל חותמות הזמן צריכות להיות בפורמט GMT. אזורי זמן אינם נתמכים. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף ( לדוגמה:
|
fully_qualified_name:x |
המחרוזת x תואמת למחרוזת המשנה fully_qualified_name. |
fully_qualified_name=x |
התאמות ל-x בתור fully_qualified_name. |
חיפוש בשפה טבעית
מילות המפתח של התנאי type, system, location ו-description, וחיפוש מאפיינים (לא כולל has) תומכים רק במאפיין ההתאמה המדויקת (=), ולא במאפיין המחרוזת המשנית (:). לדוגמה, type=foo.
Dataplex Universal Catalog תומך במגדירי החיפוש הבאים בשפה טבעית:
| מגדיר | תיאור |
|---|---|
name:x |
התאמה ל-x כמחרוזת משנה של מזהה המשאב או השם המוצג של המשאב. |
displayname:x |
התאמה של x כמחרוזת משנה של השם המוצג של המשאב. |
column:x |
המחרוזת x תואמת למחרוזת משנה של שם העמודה (או שם העמודה המקוננת) בסכימה של המשאב. |
description:x |
התאמות x כטוקן בתיאור המשאב. |
labels:bar |
הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית מכיל את המחרוזת bar. |
labels=bar |
הפונקציה מחזירה התאמה למשאבי BigQuery שיש להם תווית (עם ערך כלשהו) ומפתח התווית שווה ל-bar כמחרוזת. |
labels.bar:x |
הערך x תואם למחרוזת משנה בערך של תווית עם מפתח bar שמצורפת למשאב BigQuery. |
labels.foo=bar |
הפונקציה מחזירה משאבי BigQuery שבהם המפתח שווה ל-foo וערך המפתח שווה ל-bar. |
type=TYPE |
התנאי תואם למשאבים מסוג רשומה ספציפי או לכינוי הסוג שלה. |
projectid:bar |
המשאבים תואמים לפרויקטים ב- Google Cloud שתואמים ל-bar כמחרוזת משנה במזהה. |
parent:x |
המחרוזת x תואמת למחרוזת משנה בנתיב ההיררכי של משאב. |
system=SYSTEM |
התאמה למשאבים ממערכת שצוינה. |
location=LOCATION |
הפונקציה מחפשת משאבים במיקום שצוין עם שם מדויק.
לדוגמה, נכסי BigQuery Omni תומכים במאפיין הזה באמצעות שם המיקום ב-BigQuery Omni.
לדוגמה,
|
createtime |
חיפוש משאבים שנוצרו בטווח תאריכים או זמנים מסוים, לפני או אחרי תאריך או שעה מסוימים. לדוגמה:
הפורמט של חותמת הזמן: כל חותמות הזמן צריכות להיות בפורמט GMT. אזורי זמן אינם נתמכים. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף ( לדוגמה:
|
updatetime |
חיפוש משאבים שעודכנו בטווח תאריכים או שעות מסוים, לפני או אחרי תאריך או שעה מסוימים. לדוגמה:
הפורמט של חותמת הזמן: כל חותמות הזמן צריכות להיות בפורמט GMT. אזורי זמן אינם נתמכים. יש תמיכה בחותמות זמן חלקיות, במפרידי תאריכים עם מקף ( לדוגמה:
|
חיפוש לפי היבט
כדי לחפש רשומות לפי ההיבטים שמצורפים אליהן, משתמשים בתחביר השאילתה הבא.
חיפוש באמצעות מילות מפתח
| מגדיר | תיאור |
|---|---|
aspect:x |
המחרוזת x תואמת למחרוזת משנה של הנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID |
aspect=x |
התאמה ל-x כנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID |
aspect:xOPERATORvalue |
חיפוש ערכים בשדה המאפיין. התאמה ל- רשימת האופרטורים הנתמכים תלויה בסוג השדה בהיבט, באופן הבא:
אפשר לחפש רק בשדות ברמה העליונה של ההיבט. לדוגמה, כל השאילתות הבאות תואמות לרשומות שבהן הערך של השדה
|
חיפוש בשפה טבעית
| מגדיר | תיאור |
|---|---|
has:x |
המחרוזת x תואמת למחרוזת משנה של הנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID |
has=x |
התאמה ל-x כנתיב המלא לסוג ההיבט של היבט שמצורף לרשומה, בפורמט projectid.location.ASPECT_TYPE_ID |
xOPERATORvalue |
חיפוש ערכים בשדה המאפיין. התאמה ל-
אפשר לחפש רק בשדות ברמה העליונה של ההיבט. |
אופרטורים לוגיים
שאילתה יכולה לכלול כמה פרדיקטים עם אופרטורים לוגיים. אם לא מציינים אופרטור, ברירת המחדל היא האופרטור הלוגי AND. לדוגמה, הפקודה foo bar מחזירה משאבים שתואמים גם לפרדיקט foo וגם לפרדיקט bar.
יש תמיכה באופרטורים לוגיים AND ולוגיים OR. לדוגמה, foo OR bar.
אפשר לשלול פסוקית באמצעות הקידומת - (מקף) או NOT. לדוגמה, הפונקציה -name:foo מחזירה משאבים עם שמות שלא תואמים לפרדיקט foo.
תחביר מקוצר
יש גם תחביר מקוצר לחיפוש, שבו משתמשים ב-| (קו אנכי) לאופרטורים OR וב-, (פסיק) לאופרטורים AND.
לדוגמה, כדי לחפש רשומות באחד מתוך כמה פרויקטים באמצעות האופרטור OR, אפשר להשתמש בתחביר המקוצר הבא:
projectid:(id1|id2|id3|id4)
אותו חיפוש ללא שימוש בתחביר מקוצר נראה כך:
projectid:id1 OR projectid:id2 OR projectid:id3 OR projectid:id4
כדי לחפש רשומות עם שמות עמודות תואמים, משתמשים ב:
- AND:
column:(name1,name2,name3) - OR:
column:(name1|name2|name3)
התחביר המקוצר הזה פועל עבור הפרדיקטים המוסמכים, למעט label בחיפוש מילות מפתח.
המאמרים הבאים
- איך מחפשים משאבים ב-Dataplex Universal Catalog
- מידע נוסף על ניהול מטא-נתונים ב-Dataplex Universal Catalog
- איך משתמשים בהיבטים כדי להוסיף מטא-נתונים לרשומות
- איך מנהלים רשומות ומייבאים מקורות בהתאמה אישית