בדף הזה מוסבר איך לצפות בתצוגה מקדימה של תוצאות החיפוש באמצעות מסוף Google Cloud ואיך לקבל תוצאות חיפוש באמצעות ה-API.
בנוסף, במקום ליצור ווידג'ט חיפוש להוספה לדף האינטרנט, אפשר לבצע קריאות API ולשלב אותן בשרת או באפליקציה. בדף הזה יש דוגמאות קוד שמראות איך לבצע שאילתות חיפוש באמצעות ספריות לקוח של gRPC עם חשבון שירות.
התאמה מדויקת עם מירכאות כפולות
כדי לבצע התאמה מדויקת, אפשר להקיף את שאילתת החיפוש במירכאות כפולות (""). סוג כזה של חיפוש נקרא בדרך כלל חיפוש במרכאות.
אם לא תוחמים את שאילתת החיפוש במירכאות כפולות, החיפוש מוגדר כהתאמה חלקית. סוג כזה של חיפוש נקרא גם חיפוש ללא מרכאות.
לדוגמה, אם שאילתת החיפוש היא "query": "\"Mary had a little lamb\"", חיפוש מבוסס סוכנים יחפש את הביטוי בדיוק כמו שהוא. הוא לא יחזיר תוצאות חיפוש שמכילות את Mary had lamb, שחסרות בו מילים, או את a little lamb
had Mary, שבו המילים מופיעות בסדר שונה.
אפשר לשלב חיפוש בהתאמה מדויקת עם אופרטורים לוגיים בדרכים שונות כדי לצמצם את תוצאות החיפוש. מידע נוסף זמין במאמר בנושא תרחישים של שאילתות חיפוש.
אופרטורים לוגיים
כשמחפשים בנתונים מובְנים ובנתונים לא מובְנים עם מטא-נתונים, אפשר להוסיף אופרטורים לוגיים לחיפוש. אפשר להוסיף OR ו-AND לשאילתת החיפוש בין כמה מונחים או ביטויים. האופרטור הלוגי NOT לא נתמך
הדרך שבה מחברים את מונחי החיפוש קובעת את רמת הדיוק של התוצאות:
- וגם
- כל מונח בשאילתה חייב להופיע בתוצאות. לדוגמה, חיפוש של
jazz AND pianoיציג תוצאות שמכילות את המיליםjazzו-piano. - או
- לפחות אחד מהמונחים שבשאילתה צריך להופיע בתוצאות. לדוגמה, אם מחפשים את המחרוזת
rock OR pop, התוצאות יכללו אתrock, אתpopאו את שניהם.
אפשר לשלב בין האופרטורים הלוגיים השונים או בינם לבין חיפוש התאמה מדויקת בדרכים שונות כדי לצמצם את תוצאות החיפוש.
תרחישים של שאילתות חיפוש
בטבלה הבאה מפורטים כמה תרחישים שבהם אתם עשויים להיתקל כשאתם משתמשים בחיפוש בהתאמה מדויקת או בהתאמה חלקית.
| תרחיש | תיאור | דוגמה |
|---|---|---|
| חיפוש בהתאמה חלקית ללא אופרטורים לוגיים | אם אין מירכאות כפולות סביב מונחי החיפוש ואין אופרטורים לוגיים ביניהם, החיפוש מתבצע כאילו יש אופרטור AND בין המונחים. יכול להיות שהתוצאות יכללו גם מסמכים אחרים שחיפוש מבוסס סוכנים חושב שהם רלוונטיים לשאילתה בגלל חיפוש סמנטי. |
"query": "Mary little lamb"
בשאילתה הזו, המסמכים הכי רלוונטיים בתשובה מכילים את כל המונחים |
| חיפוש של התאמה מדויקת ללא אופרטורים לוגיים | אם יש מירכאות כפולות סביב כמה מונחי חיפוש או ביטויים נפרדים, ואין ביניהם אופרטורים לוגיים, החיפוש יתבצע כאילו יש אופרטור AND בין הביטויים. כשמוסיפים מירכאות כפולות לפחות למונח חיפוש אחד בשאילתה, החיפוש הסמנטי מושבת בשאילתה כולה. |
"query": "\"Mary\" \"little lamb\""
בשאילתה הזו, החיפוש יניב תוצאות שמכילות את שני הביטויים
|
| חיפוש של התאמה מדויקת והתאמה חלקית | כשמוסיפים מירכאות כפולות למונח חיפוש אחד לפחות בשאילתה, החיפוש הסמנטי מושבת בשאילתה כולה.
אם מציינים אופרטורים לוגיים, המערכת מתייחסת אליהם כמו שהם מצוינים. אם לא מציינים אופרטורים לוגיים בשאילתה, החיפוש פועל כאילו יש אופרטור AND בין הביטויים. |
"query": "Mary \"little lamb\""
בשאילתה הזו, החיפוש מתבצע כאילו יש אופרטור |
איך מקבלים תוצאות חיפוש לאפליקציה עם נתוני אתר
המסוף
כדי להשתמש במסוף Google Cloud כדי לראות תצוגה מקדימה של תוצאות חיפוש לאפליקציה עם נתונים מאתר, פועלים לפי השלבים הבאים:
נכנסים לדף AI Applications במסוף Google Cloud .
לוחצים על שם האפליקציה שרוצים לערוך.
לוחצים על תצוגה מקדימה.
פותחים את הדף Preview במסוף.
אופציונלי: אם קישרתם כמה מאגרי נתונים לאפליקציה אבל אתם רוצים לקבל תוצאות רק ממאגר נתונים ספציפי, בוחרים את מאגר הנתונים שממנו רוצים לקבל תוצאות.
מקלידים שאילתת חיפוש.
אם הפעלתם את ההשלמה האוטומטית, בזמן ההקלדה תופיע רשימה של הצעות להשלמה אוטומטית מתחת לסרגל החיפוש.
מקישים על Enter כדי לשלוח את השאילתה.
- רשימה של תוצאות החיפוש מופיעה מתחת לסרגל החיפוש.
- כל תוצאה מכילה כותרת, תקציר וכתובת URL.
- לחיצה על תוצאה פותחת את כתובת ה-URL.
- אם תכונות מתקדמות של LLM מופעלות באפליקציה, יכול להיות שתוצג גם תשובה שנוצרה.
REST
כדי להשתמש ב-API כדי לקבל תוצאות חיפוש של אפליקציה עם נתונים של אתר, משתמשים ב-method engines.servingConfigs.search:
מאתרים את מזהה האפליקציה. אם כבר יש לכם מזהה אפליקציה, דלגו לשלב הבא.
נכנסים לדף AI Applications במסוף Google Cloud .
בדף אפליקציות, מאתרים את שם האפליקציה ומעתיקים את המזהה שלה מהעמודה מזהה.
מקבלים תוצאות חיפוש.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \ -d '{ "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search", "query": "QUERY", "pageSize": "PAGE_SIZE", "offset": "OFFSET", "orderBy": "ORDER_BY", "params": {"user_country_code": "USER_COUNTRY_CODE", "searchType": "SEARCH_TYPE"}, "filter": "FILTER", "boostSpec": "BOOST_SPEC", "contentSearchSpec": { "searchResultMode": "RESULT_MODE" }, "userPseudoId": "USER_PSEUDO_ID", "dataStoreSpecs": [{"DATA_STORE_SPEC"}] }'מחליפים את מה שכתוב בשדות הבאים:
-
PROJECT_ID: מזהה הפרויקט ב- Google Cloud . APP_ID: המזהה של אפליקציית חיפוש מבוסס סוכנים שרוצים לשלוח אליה שאילתה.-
QUERY: טקסט השאילתה לחיפוש.
PAGE_SIZE: מספר התוצאות שהוחזרו מהחיפוש. הגודל המקסימלי המותר של הדף תלוי בסוג הנתונים. אם גודל הדף גבוה מהערך המקסימלי, הוא ישתנה לערך המקסימלי.- אתרים עם הוספה בסיסית לאינדקס: ברירת מחדל
10, מקסימום25 - אתרים עם הוספה מתקדמת לאינדקס: ברירת מחדל
25, מקסימום50 - אחר: ברירת מחדל
50, מקסימום100
- אתרים עם הוספה בסיסית לאינדקס: ברירת מחדל
OFFSET: אינדקס ההתחלה של התוצאות. ערך ברירת המחדל הוא 0.לדוגמה, אם ההיסט הוא 2, גודל הדף הוא 10 ויש 15 תוצאות להחזרה, התוצאות 2 עד 12 מוחזרות בדף הראשון.
ORDER_BY: הסדר שבו התוצאות מסודרות. למאפיין שלפיו רוצים למיין צריך להיות ערך מספרי, למשלdate. מידע נוסף מופיע במאמר בנושא הזמנת תוצאות חיפוש באינטרנט.
USER_COUNTRY_CODE: מיקום המשתמש. צמד המפתח/ערך הזה הוא הרשומה היחידה שנתמכת בשדה המפהparams. ערך ברירת המחדל הוא ריק. ערכים קבילים מפורטים במאמר בנושא קודי מדינות במסמכי העיון של Programmable Search Engine JSON API.
SEARCH_TYPE: סוג החיפוש שרוצים לבצע. ערך ברירת המחדל הוא 0 לחיפוש במסמך. הערך הנתמך השני הוא 1 לחיפוש תמונות.
FILTER: שדה טקסט לסינון החיפוש באמצעות ביטוי סינון. ערך ברירת המחדל הוא מחרוזת ריקה. מידע נוסף על השימוש בשדהfilterזמין במאמר בנושא סינון חיפוש באתר.
BOOST_SPEC: אופציונלי. מפרט להדגשה או להסתרת מסמכים. ערכים:-
BOOST: מספר בשיטת נקודה צפה בטווח [-1,1]. אם הערך שלילי, התוצאות יורדות בדירוג (הן יופיעו בחלק התחתון של התוצאות). אם הערך חיובי, התוצאות מקודמות (מופיעות גבוה יותר בתוצאות). -
CONDITION: ביטוי של מסנן טקסט לבחירת המסמכים שיוחלו עליהם הגדלות. המסנן צריך להחזיר ערך בוליאני. דוגמאות לביטויי סינון מופיעות במאמרים תחביר של ביטויי סינון ותחביר של הוספה מתקדמת לאינדקס. מידע על שיפור תוצאות חיפוש מובנה זמין במאמר שיפור תוצאות חיפוש.
-
RESULT_MODE: קובע אם תוצאות החיפוש יוחזרו כמסמכים מלאים או בחלקים. כדי לקבל נתחים, צריך להפעיל את האפשרות 'חלוקת מסמכים לנתחים' במאגר הנתונים. הערכים הקבילים הםdocumentsו-chunks. כשחיתוך לחלקים מופעל במאגר נתונים, ערך ברירת המחדל הואchunks. אחרת, ברירת המחדל היאdocuments. מידע על חלוקת מסמכים לחלקים זמין במאמר ניתוח מסמכים וחלוקה שלהם לחלקים. השדה הזה נמצא בגרסת Public Preview. כדי להשתמש בו, צריך לשנות אתv1ל-v1alphaבפקודת curl.
USER_PSEUDO_ID: מחרוזת בקידוד UTF-8, שמשמשת כמזהה ייחודי פסאודונימי למעקב אחרי המשתמשים. האורך המקסימלי הוא 128 תווים. Google ממליצה מאוד להשתמש בשדה הזה כי הוא משפר את הביצועים של המודל ואת איכות ההתאמה האישית. אפשר להשתמש בקובץ Cookie של HTTP בשדה הזה, כדי לזהות באופן ייחודי מבקר במכשיר יחיד. הנה כמה דברים חשובים שכדאי לזכור:- המזהה הזה לא משתנה כשהמבקר נכנס לאתר או יוצא ממנו.
- אסור להגדיר את אותו מזהה למשתמשים שונים בשדה הזה. במקרים אחרים, שימוש באותו מזהה משתמש לכמה משתמשים עלול לשלב היסטוריית אירועים של משתמשים שונים ולהפחית את איכות המודל.
- השדה הזה לא יכול לכלול פרטים אישיים מזהים (PII).
- לכל בקשת חיפוש או בקשת עיון, השדה הזה צריך להיות ממופה לשדה
userPseudoIdהמתאים באירועי המשתמש.
מידע נוסף זמין במאמר
userPseudoId.
DATA_STORE_SPEC: מסננים של מאגר נתונים ספציפי לחיפוש. משתמשים ב-dataStoreSpecsאם אפליקציית החיפוש מקושרת לכמה מאגרי נתונים, אבל רוצים לקבל תוצאות ממאגר נתונים ספציפי. מידע נוסף זמין במאמר בנושא DataStoreSpec.
-
C#
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים C#.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Java.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Node.js.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים PHP.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Python.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Ruby
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Ruby.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
קבלת תוצאות חיפוש לאפליקציה עם נתוני אתר (מפתח API)
אם רוצים לאמת את הפעלת method החיפוש באמצעות מפתח API במקום להשתמש ב-OAuth 2.0 דרך חשבון שירות או חשבון משתמש, צריך לפעול לפי ההליך הזה, שבו משתמשים בשיטה searchLite.
לשיטה searchLite יש את אותן תכונות כמו לשיטה search, אבל אפשר להשתמש בה רק כדי לחפש באתרים ציבוריים.
השיטה searchLite מתאימה במיוחד בתנאים הבאים:
יש לכם אתר סטטי שאי אפשר להגדיר בו OAuth 2.0 דרך חשבון שירות או חשבון משתמש.
עברתם לחיפוש מבוסס סוכנים מ-Custom Search Site Restricted API בפורמט JSON של Programmable Search Engine.
לא רוצים להשתמש בווידג'ט החיפוש.
לפני שמתחילים
כדי להפעיל את ה-method servingConfigs.searchLite, אתם צריכים מפתח API. אם אין לכם מפתח API, צריך להשלים את שלב 1 במאמר פריסת אפליקציית החיפוש (מפתח API).
התהליך
REST
כדי להשתמש ב-API כדי לקבל תוצאות חיפוש של אפליקציה עם נתונים של אתר ציבורי שאומתו באמצעות מפתח API, משתמשים ב-method engines.servingConfigs.searchLite:
מאתרים את מזהה האפליקציה. אם כבר יש לכם מזהה אפליקציה, דלגו לשלב הבא.
נכנסים לדף AI Applications במסוף Google Cloud .
בדף אפליקציות, מאתרים את שם האפליקציה ומעתיקים את המזהה שלה מהעמודה מזהה.
מריצים את פקודת ה-Curl הבאה כדי לקבל תוצאות חיפוש:
curl -X POST -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:searchLite?key=API_KEY" \ -d '{ "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search", "query": "QUERY", "userPseudoId": "USER_PSEUDO_ID" }'מחליפים את מה שכתוב בשדות הבאים:
PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
API_KEY: מחרוזת מפתח ה-API.
PROJECT_ID: מזהה הפרויקט ב- Google Cloud .APP_ID: המזהה של אפליקציית חיפוש מבוסס סוכנים שרוצים לשלוח אליה שאילתה.
QUERY: טקסט השאילתה לחיפוש.
USER_PSEUDO_ID: מחרוזת בקידוד UTF-8, שמשמשת כמזהה ייחודי פסאודונימי למעקב אחרי המשתמשים. האורך המקסימלי הוא 128 תווים. Google ממליצה מאוד להשתמש בשדה הזה כי הוא משפר את הביצועים של המודל ואת איכות ההתאמה האישית. אפשר להשתמש בקובץ Cookie של HTTP בשדה הזה, כדי לזהות באופן ייחודי מבקר במכשיר יחיד. הנה כמה דברים חשובים שכדאי לזכור:- המזהה הזה לא משתנה כשהמבקר נכנס לאתר או יוצא ממנו.
- אסור להגדיר את אותו מזהה למשתמשים שונים בשדה הזה. במקרים אחרים, שימוש באותו מזהה משתמש לכמה משתמשים עלול לשלב היסטוריית אירועים של משתמשים שונים ולהפחית את איכות המודל.
- השדה הזה לא יכול לכלול פרטים אישיים מזהים (PII).
- לכל בקשת חיפוש או בקשת עיון, השדה הזה צריך להיות ממופה לשדה
userPseudoIdהמתאים באירועי המשתמש.
מידע נוסף זמין במאמר
userPseudoId.
Python
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Python.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
קבלת תוצאות חיפוש לאפליקציה עם נתונים מובְנים או לא מובְנים
אפשר לראות תצוגה מקדימה של תוצאות החיפוש במסוף Google Cloud או לקבל תוצאות חיפוש באמצעות ה-API.
המסוף
כדי להשתמש במסוף Google Cloud כדי לראות תצוגה מקדימה של תוצאות חיפוש לאפליקציה עם נתונים מובְנים או לא מובְנים, פועלים לפי השלבים הבאים:
- פותחים את הדף Preview במסוף.
מקלידים שאילתת חיפוש.
אם הפעלתם את ההשלמה האוטומטית, בזמן ההקלדה תופיע רשימה של הצעות להשלמה אוטומטית מתחת לסרגל החיפוש.
(אופציונלי) אם קישרתם כמה מאגרי נתונים לאפליקציה אבל אתם רוצים לקבל תוצאות רק ממאגר נתונים ספציפי, בוחרים את מאגר הנתונים שממנו רוצים לקבל תוצאות.
מקישים על Enter כדי לשלוח את השאילתה.
רשימה של תוצאות החיפוש מופיעה מתחת לסרגל החיפוש.
לנתונים מובְנים, חלים התנאים הבאים:
אם מיפויי המאפיינים לא מוגדרים בConfigurations (הגדרות) > Configure fields in results (הגדרת שדות בתוצאות), תוצאות החיפוש מוצגות כרשימה של שמות וערכים של מאפיינים גולמיים.
אם מיפויי מאפיינים נשמרו בהגדרות > הגדרת שדות בתוצאות, תוצאות החיפוש יוצגו כמו בתצוגה המקדימה בדף הגדרות.
אם צוינו היבטים כלשהם בהגדרות > הגדרות היבטים, הם יוצגו באותו אופן.
REST
כדי להשתמש ב-API כדי לקבל תוצאות חיפוש של אפליקציה עם נתונים מובנים או לא מובנים, משתמשים ב-method engines.servingConfigs.search:
מאתרים את מזהה האפליקציה. אם כבר יש לכם מזהה אפליקציה, דלגו לשלב הבא.
נכנסים לדף AI Applications במסוף Google Cloud .
בדף אפליקציות, מאתרים את שם האפליקציה ומעתיקים את המזהה שלה מהעמודה מזהה.
מקבלים תוצאות חיפוש.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \ -d '{ "query": "QUERY", "userPseudoId": "USER_PSEUDO_ID", "pageSize": "PAGE_SIZE", "offset": "OFFSET", "orderBy": "ORDER_BY", "filter": "FILTER", "boostSpec": "BOOST_SPEC", "facetSpec": "FACET_SPEC", "queryExpansionSpec": "QUERY_EXPANSION_SPEC", "spellCorrectionSpec": "SPELL_CORRECTION_SPEC", "contentSearchSpec": "CONTENT_SEARCH_SPEC", "dataStoreSpecs": [{"DATA_STORE_SPEC"}], }'מחליפים את מה שכתוב בשדות הבאים:
-
PROJECT_ID: מזהה הפרויקט ב- Google Cloud . APP_ID: המזהה של אפליקציית חיפוש מבוסס סוכנים שרוצים לשלוח אליה שאילתה.-
QUERY: טקסט השאילתה לחיפוש.
USER_PSEUDO_ID: מחרוזת בקידוד UTF-8, שמשמשת כמזהה ייחודי פסאודונימי למעקב אחרי המשתמשים. האורך המקסימלי הוא 128 תווים. Google ממליצה מאוד להשתמש בשדה הזה כי הוא משפר את הביצועים של המודל ואת איכות ההתאמה האישית. אפשר להשתמש בקובץ Cookie של HTTP בשדה הזה, כדי לזהות באופן ייחודי מבקר במכשיר יחיד. הנה כמה דברים חשובים שכדאי לזכור:- המזהה הזה לא משתנה כשהמבקר נכנס לאתר או יוצא ממנו.
- אסור להגדיר את אותו מזהה למשתמשים שונים בשדה הזה. במקרים אחרים, שימוש באותו מזהה משתמש לכמה משתמשים עלול לשלב היסטוריית אירועים של משתמשים שונים ולהפחית את איכות המודל.
- השדה הזה לא יכול לכלול פרטים אישיים מזהים (PII).
- לכל בקשת חיפוש או בקשת עיון, השדה הזה צריך להיות ממופה לשדה
userPseudoIdהמתאים באירועי המשתמש.
מידע נוסף זמין במאמר
userPseudoId.
PAGE_SIZE: מספר התוצאות שמוחזרות על ידי החיפוש. הגודל המקסימלי המותר של הדף תלוי בסוג הנתונים. אם גודל הדף גדול מהערך המקסימלי, הוא ישתנה לערך המקסימלי.- אתרים עם הוספה בסיסית לאינדקס: ברירת מחדל
10, מקסימום25 - אתרים עם הוספה מתקדמת לאינדקס: ברירת מחדל
25, מקסימום50 - אחר: ברירת מחדל
50, מקסימום100
- אתרים עם הוספה בסיסית לאינדקס: ברירת מחדל
OFFSET: אופציונלי. האינדקס ההתחלתי של התוצאות. ערך ברירת המחדל הוא 0.לדוגמה, אם ההיסט הוא 2, גודל הדף הוא 10 ויש 15 תוצאות להחזרה, התוצאות 2 עד 11 מוחזרות בדף הראשון.
ORDER_BY: אופציונלי. הסדר שבו התוצאות מסודרות.
FILTER: אופציונלי. שדה טקסט לסינון החיפוש באמצעות ביטוי סינון. ערך ברירת המחדל הוא מחרוזת ריקה, כלומר לא מוחל מסנן.לדוגמה:
color: ANY("red", "blue") AND score: IN(*, 100.0e)מידע נוסף מופיע במאמר בנושא סינון חיפוש של נתונים מובְנים או לא מובְנים.
BOOST_SPEC: אופציונלי. מפרט להדגשת מסמכים או להסתרתם. ערכים:-
BOOST: מספר בשיטת נקודה צפה בטווח [-1,1]. אם הערך שלילי, התוצאות יורדות בדירוג (הן יופיעו בחלק התחתון של התוצאות). אם הערך חיובי, התוצאות מקודמות (מופיעות גבוה יותר בתוצאות). -
CONDITION: ביטוי של מסנן טקסט לבחירת המסמכים שיוחלו עליהם הגדלות. המסנן צריך להחזיר ערך בוליאני. דוגמאות לביטויי סינון מופיעות במאמרים תחביר של ביטויי סינון ותחביר של הוספה מתקדמת לאינדקס.
מידע על שיפור תוצאות חיפוש מובנה זמין במאמר שיפור תוצאות חיפוש.
-
FACET_SPEC: אופציונלי. מפרט של היבט לביצוע חיפוש עם היבטים.
QUERY_EXPANSION_SPEC: אופציונלי. הגדרה שקובעת באילו תנאים יתבצע הרחבת שאילתה. ערך ברירת המחדל הואDISABLED.
SPELL_CORRECTION_SPEC: אופציונלי. מפרט לקביעה של התנאים שבהם צריך לבצע תיקון שגיאות כתיב. ערך ברירת המחדל הואAUTO.
CONTENT_SEARCH_SPEC: אופציונלי. לקבלת תקצירים, תשובות חילוץ, פלחים חילוץ וסיכומי חיפוש. לנתונים לא מובנים בלבד. למידע נוסף:
DATA_STORE_SPEC: מסננים של מאגר נתונים ספציפי לחיפוש. אפשר להשתמש באפשרות הזו אם אפליקציית החיפוש שלכם מקושרת לכמה מאגרי נתונים.צפייה בתוצאות חיפוש מודרך בתגובה לחיפוש:
תוצאות חיפוש מודרכות מוחזרות עם תשובות לחיפושים מובנים ולא מובנים. תוצאת החיפוש המודרך מכילה רשימה של צמדי מפתח/ערך של מאפיינים שחולצו על סמך מסמכי תוצאות החיפוש. כך המשתמשים יכולים לצמצם את תוצאות החיפוש באמצעות מפתחות וערכים של מאפיינים מסוימים כמסננים.
בדוגמה הזו לתגובה, נעשה שימוש בצבע ירוק כדי לצמצם את תוצאות החיפוש על ידי שליחת בקשת חיפוש חדשה עם שדה הסינון שצוין כ-
_gs.color: ANY("green"):{ "guidedSearchResult": { "refinementAttributes": [ { "attributeKey": "_gs.color", "attributeValue": "green" }, { "attributeKey": "_gs.category", "attributeValue": "shoe" } ] } }
-
C#
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים C#.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Java
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Java.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Node.js
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Node.js.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
PHP
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים PHP.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Python
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Python.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
Ruby
מידע נוסף מופיע בתיעוד העזר של ה-API של חיפוש מבוסס סוכנים Ruby.
כדי לבצע אימות ב-חיפוש מבוסס סוכנים, צריך להגדיר את Application Default Credentials. מידע נוסף זמין במאמר הגדרת אימות לסביבת פיתוח מקומית.
קבלת ציוני רלוונטיות של מסמכים עם תוצאות החיפוש
ציוני הרלוונטיות של המסמכים מבוססים על הדמיון בין השאילתה לבין המסמך. הציונים מחולקים ל-11 קטגוריות בטווח: 0, 0.1, 0.2 ועד 1.0. ככל שהציון גבוה יותר, כך המסמך רלוונטי יותר.
כדאי להשתמש בציוני הרלוונטיות של המסמכים בתרחישי השימוש הבאים:
סינון אחרי החיפוש על סמך ציון הרלוונטיות כדי להסיר תוצאות לא רלוונטיות
דירוג אחרי החיפוש או כקלט לאפליקציות אחרות
ניפוי באגים: ציוני הרלוונטיות יכולים לספק תובנות לגבי הסיבות להחזרת תוצאות חיפוש מסוימות
לכל תוצאת חיפוש אפשר להחזיר ציון רלוונטיות:
"results": [
{
"id": "DOCUMENT_ID",
"document": {
...
},
"modelScores": {
"relevance_score": {
"values": [
DOCUMENT-RELEVANCE-SCORE
]
}
}
},
...
]
אפשר גם לעיין בדוגמה לפקודה שמופיעה בהמשך.
לפני שמתחילים: מוודאים שאפליקציית החיפוש משויכת למאגר נתונים מובְנים או לא מובְנים. כלומר, אי אפשר להחזיר ציוני רלוונטיות של מסמכים באפליקציה לחיפוש באתר.
REST
כדי לבקש שהציונים של הרלוונטיות של המסמכים יוחזרו עם תוצאות החיפוש, משתמשים בשיטה engines.servingConfigs.search באופן הבא:
- השלב של עיבוד התוצאות אחרי החיפוש.
מאתרים את מזהה האפליקציה. אם כבר יש לכם מזהה אפליקציה, דלגו לשלב הבא.
נכנסים לדף AI Applications במסוף Google Cloud .
בדף אפליקציות, מאתרים את שם האפליקציה ומעתיקים את המזהה שלה מהעמודה מזהה.
מריצים את פקודת ה-Curl הבאה כדי לקבל את הציונים שמוחזרים עם תוצאות החיפוש.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \ -d '{ "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search", "query": "QUERY", "relevanceScoreSpec": { "returnRelevanceScore": true } }'-
PROJECT_ID: מזהה הפרויקט ב- Google Cloud . APP_ID: המזהה של אפליקציית חיפוש מבוסס סוכנים שרוצים לשלוח אליה שאילתה.-
QUERY: טקסט השאילתה לחיפוש.
-
סיכום החיפוש משתנה בהתאם למודל
אם אתם יוצרים סיכומים של שאילתות החיפוש, יכול להיות שתשימו לב שהסיכומים שונים בין התוצאות במסוף לבין התוצאות ב-API. אם אתם רואים את ההודעה הזו, סביר להניח שהסיבה לכך היא שהמסוף משתמש במודל LLM שונה מזה שמשמש את ה-API. בדוגמאות הקוד וב-curl שבדף הזה נעשה שימוש במודל LLM יציב.
כדי לשנות או להציג את מודל ה-LLM שבו נעשה שימוש בדף תצוגה מקדימה בממשק המשתמש (נתמך רק באפליקציות לחיפוש מתקדם ובאפליקציות בתחום הבריאות).
- עוברים לדף Configurations (הגדרות) של האפליקציה > הכרטיסייה UI (ממשק משתמש).
בוחרים סוג חיפוש:
- בוחרים באפשרות חיפוש עם תשובה כדי להציג סיכום גנרטיבי מעל תוצאות החיפוש.
- בוחרים באפשרות חיפוש עם שאלות המשך כדי להפעיל חיפוש שיחות עם סיכומים גנרטיביים ושאלות המשך.
בקטע מודלים גדולים של שפה לסיכום, בוחרים מודל.
במקרה של קריאות לשיטות, מודל ברירת המחדל הוא המודל היציב. כדי להשתמש במודל LLM שאינו המודל היציב, אפשר לעיין במאמרים ציון מודל הסיכום וציון מודל התשובה.
השלבים הבאים
אפשר להשתמש ב-Search API כדי לדפדף בנתונים באפליקציות החיפוש הכלליות.