בדף הזה מוסבר איך השליפה והדירוג פועלים יחד כדי לספק תוצאות חיפוש רלוונטיות באפליקציות של חיפוש מבוסס סוכנים.
סקירה כללית
בקיצור, אחזור הוא מציאת מסמכים רלוונטיים, ודירוג הוא סידור המסמכים שאוחזרו. דירוג כל המסמכים הזמינים יכול להיות תהליך שדורש הרבה משאבי מחשוב. לכן, השליפה והדירוג מתבצעים ברצף.
קודם, מודל החיפוש מבין את השאילתה וכותב אותה מחדש. לאחר מכן, בהתאם למקורות הנתונים הזמינים ולמספר המסמכים שעברו אינדוקס במאגר הנתונים, המודל מאחזר אלפי מסמכים. למסמכים שאוחזרו מוקצה ציון רלוונטיות.
לאחר מכן, מודל הדירוג מסדר את המסמכים שאוחזרו ומציג את 400 התוצאות המובילות. בתמונה הבאה אפשר לראות איך שני התהליכים האלה משתלבים בתהליך העבודה של החיפוש.
שיטות לאחזור
אחזור הוא תהליך של בחירת קבוצת משנה של מסמכים ממאגר הנתונים שרלוונטיים לשאילתה של משתמש. מודל חיפוש מבוסס סוכנים מנהל את האחזור של אפליקציות החיפוש על סמך אותות שונים, כמו האותות הבאים, ומקצה ציוני רלוונטיות:
רלוונטיות לנושא: כולל התאמה למילות מפתח, תרשימי ידע ואותות מהאינטרנט.
הטמעות: כולל הטמעות כדי למצוא תוכן דומה מבחינה רעיונית.
הצלבת תשומת לב: מאפשרת למודל להתייחס לקשר בין שאילתה לבין מסמך כדי להקצות למסמך ציון רלוונטיות.
עדכניות: בדיקה של גיל המסמכים במאגר הנתונים.
אירועים שקשורים למשתמש: כולל אותות המרה שמשמשים להתאמה אישית.
בנוסף, בבקשת חיפוש אפשר לספק מסנני רלוונטיות ומסנני מטא-נתונים של נתוני אתרים ושל נתונים מובְנים או לא מובְנים כדי לצמצם את רשימת המסמכים הרלוונטיים.
שיטות דירוג
בשלב הדירוג, המערכת לוקחת את המסמכים שנבחרו בשלב האחזור, מקצה להם ציון רלוונטיות חדש בהתאם לתנאים הבאים ומסדרת אותם מחדש:
- הדגשה: קידום או הורדה של תוצאות מסוימות בהתאם למאפיינים מותאמים אישית או למידת הרלוונטיות שלהן. ההגדרה הזו משפיעה על 1,000 המסמכים הראשונים שאוחזרו, ומדרגת את 400 המסמכים המובילים. מידע נוסף זמין במאמר בנושא שיפור תוצאות החיפוש.
- דירוג בהתאמה אישית: שליטה, כוונון וביטול של לוגיקת הדירוג שמוגדרת כברירת מחדל באמצעות אלגוריתם דירוג שמבוסס על נוסחה, כדי להתאים לדרישות הספציפיות שלכם. כשמציגים את התוצאות, הדירוג שמוקצה על ידי הדירוג המותאם אישית מקבל עדיפות. מידע נוסף זמין במאמר בנושא התאמה אישית של דירוג תוצאות החיפוש.
- הזמנה: החלת הוראות הזמנה, למשל לפי תאריך.
- התאמת החיפוש: משפיעה על האופן שבו המודל תופס את הרלוונטיות הסמנטית של המסמכים שלכם, ומשנה את ציוני הרלוונטיות של ההטמעה. מידע נוסף זמין במאמר בנושא שיפור תוצאות החיפוש באמצעות התאמת החיפוש.
- דירוג מחדש מבוסס-אירועים: המערכת מעדכנת את התוצאות בזמן ההצגה באמצעות מודל התאמה אישית מבוסס-אירועים של משתמשים.