בדיקת איכות הנתונים של המלצות למדיה

בדף הזה מוסבר איך בודקים אם מדדים שונים של נתוני המדיה עומדים בספי דרישות.

מידע על בדיקת האיכות של נתוני המדיה

אירועים עדכניים של משתמשים חשובים מאוד להמלצות על מדיה, ולכן חשוב לבדוק באופן קבוע את האיכות של הנתונים והאירועים של המשתמשים שמועברים למערכת. כדי לעשות את זה, אפשר לעיין בכרטיסייה אופטימיזציה באפליקציית ההמלצות למדיה כדי לראות אילו שיפורים אפשר לבצע בנתונים כדי לשפר את איכות ההמלצות.

אם הנתונים של מדד מסוים לא מגיעים לסף, הסטטוס של המדד יהיה'אזהרה'. לאחר מכן, צריך לבדוק את המדד ואת התיאור שלו כדי להבין איזו פעולה צריך לבצע כדי לשפר את איכות המדיה.

כל המודלים והיעדים צריכים לעמוד בסף של מדד האיכות הכללית. לחלק מהמודלים והיעדים יש מדדים וערכי סף נוספים של איכות ספציפית לאפליקציה. מדדי האיכות הכלליים זהים לכל האפליקציות שמשתמשות באותו מאגר נתונים, אבל מדדי האיכות הספציפיים לאפליקציה משתנים בהתאם למודל ולמטרות של האפליקציה.

מידע על המודלים והיעדים של ההמלצות זמין במאמר מידע על סוגי ההמלצות באפליקציות מדיה.

בדיקת איכות הנתונים

המסוף

כדי לבדוק את האיכות של נתוני ההמלצות למדיה:

  1. נכנסים לדף AI Applications במסוף Google Cloud .

    אפליקציות AI

  2. לוחצים על השם של האפליקציה להמלצות על מדיה שרוצים לבדוק את איכות הנתונים שלה.

  3. בתפריט הניווט, לוחצים על איכות הנתונים ואז על הכרטיסייה אופטימיזציה. בדף הזה מוצג הסטטוס של מדדים שונים לגבי הנתונים שמשויכים לאפליקציה שלכם.

  4. בחלק העליון של הדף, בודקים את הסטטוסים איכות כללית ואיכות ספציפית לאפליקציה. אם אחד או יותר מהמדדים חרגו מהערך הסף שלהם, סטטוס הסיכום בחלק העליון של הדף מוצג כאזהרה.

    בטבלאות של שני המדדים (איכות כללית ואיכות ספציפית לאפליקציה) מפורטים המדדים השונים.

    בכרטיסיית האופטימיזציה מוצג מדד אזהרה אחד לגבי האיכות הכללית
doc_with_same_title_percentage

  5. בטבלאות המדדים, לוחצים על הצגת פרטים כדי לקבל מידע נוסף על מדדים במצב אזהרה.

  6. אופציונלי: כדי לראות את ערך הסף של מדד שעומד בדרישות, לוחצים על הצגת פרטים. סף הערכים למדדים שעומדים בדרישות לא מוצג בטבלת המדדים.

REST

כדי לבדוק את איכות הנתונים של ההמלצות למדיה, אפשר להשתמש בשיטה requirements:checkRequirement, כמו שמוצג.

כדי לבדוק את האיכות משורת הפקודה, פועלים לפי השלבים הבאים:

  1. איך מוצאים את המזהה של מאגר הנתונים אם כבר יש לכם מזהה של מאגר נתונים, אפשר לדלג לשלב הבא.

    1. במסוף Google Cloud , עוברים לדף AI Applications ובתפריט הניווט לוחצים על Data Stores.

      מעבר לדף Data Stores

    2. לוחצים על השם של מאגר הנתונים.

    3. בדף Data של מאגר הנתונים, מעתיקים את המזהה של מאגר הנתונים.

  2. מריצים את פקודת ה-Curl הבאה כדי לדעת אם ההמלצות למדיה עומדות בספי המדדים הכלליים:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-GFE-SSL: yes" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/requirements:checkRequirement" \
    -d '{
          "location": "projects/PROJECT_ID/locations/global",
          "requirementType": "discoveryengine.googleapis.com/media_recs/general/all/warning",
          "resources": [
            {
              "labels": {
                "branch_id": "0",
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/Branch"
            },
            {
              "labels": {
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/DataStore"
            }
          ]
        }'
    

    מחליפים את מה שכתוב בשדות הבאים:

    • PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
    • DATA_STORE_ID: המזהה של מאגר הנתונים של חיפוש מבוסס סוכנים.
  3. בודקים את הפלט:

    1. מחפשים את הערך של result:

      • אם הערך הוא SUCCESS, הנתונים עומדים בדרישות הכלליות. ממשיכים לשלב 4.

      • אם הערך הוא WARNING, ממשיכים לשלב ב'.

      • אם לא מופיע result בפלט, יכולות להיות לכך כמה סיבות:

        • הקוד PROJECT_ID או DATA_STORE_ID בבקשה שגוי.

        • חלק מערכי המדדים לא זמינים. אפשר לנסות שוב בעוד 6 שעות או לפנות למהנדס לקוחות לקבלת עזרה.

    2. מחפשים את הביטוי (requirement.Condition.Expression): אם הביטוי הזה מחזיר ערך false, יש בעיה בנתונים.

      הערך של המדדים נמצא בשדה requirementCondition.metricResults.value. ערכי סף האזהרה מופיעים בשדות thresholdBindings.thresholdValues. השדות description יכולים לעזור לכם להבין את המטרה של המדד.

      לדוגמה, הערך של doc_with_same_title_percentage הוא 30.47 וסף האזהרה של doc_with_same_title_percentage_threshold הוא 1. יש בעיה בנתונים, כי הרבה מהשמות במאגר הנתונים זהים, וצריך לבדוק את זה.

  4. אם השילוב של המודל והיעד שמשמשים את אפליקציית ההמלצות שלכם מופיע בטבלה הזו, אתם צריכים גם להפעיל את השיטה check requirement, שמעודכנת עם הערכים של המודל והיעד שלכם:

    דגם מטרה MODEL_OBJ
    עוד אפליקציות שאולי יעניינו אותך שיעור המרה oyml/cvr
    מומלץ בשבילך שיעור המרה rfy/cvr
    עוד תוכן דומה שיעור המרה mlt/cvr
    הפופולרי ביותר שיעור המרה mp/cvr
    עוד אפליקציות שאולי יעניינו אותך משך הצפייה בכל סשן oyml/wdps
    מומלץ בשבילך משך הצפייה בכל סשן rfy/wdps
    עוד תוכן דומה משך הצפייה בכל סשן mlt/wdps

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-GFE-SSL: yes" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/requirements:checkRequirement" \
    -d '{
          "location": "projects/PROJECT_ID/locations/global",
          "requirementType": "discoveryengine.googleapis.com/media_recs/MODEL_OBJ/warning",
          "resources": [
            {
              "labels": {
                "branch_id": "0",
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/Branch"
            },
            {
              "labels": {
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/DataStore"
            }
          ]
        }'
    

    מחליפים את מה שכתוב בשדות הבאים:

    • PROJECT_ID: מזהה הפרויקט ב- Google Cloud .
    • DATA_STORE_ID: המזהה של מאגר הנתונים של חיפוש מבוסס סוכנים.
    • MODEL_OBJ: אפשר לעיין בטבלה הקודמת כדי לבחור את הערך הנכון לאפליקציית ההמלצות.
  5. בודקים את הפלט:

    1. מחפשים את הערך של result:

      • אם הערך הוא SUCCESS, הנתונים שלכם טובים מספיק.

      • אם הערך הוא WARNING, ממשיכים לשלב ב'.

      • אם לא מופיע result בפלט, יכולות להיות לכך כמה סיבות:

        • הקוד PROJECT_ID או DATA_STORE_ID בבקשה שגוי.

        • חלק מערכי המדדים לא זמינים. אפשר לנסות שוב בעוד 6 שעות או לפנות למהנדס לקוחות לקבלת עזרה.

    2. בודקים את הביטוי (requirement.Condition.Expression). אם הערך של הביטוי הזה הוא false, יש בעיה בנתונים.

      הערך של המדדים מופיע בשדה requirementCondition.metricResults.value, וערכי הסף של האזהרה מופיעים בשדות thresholdBindings.thresholdValues. description השדות יכולים לעזור לכם להבין את המטרה של המדד.