שימוש בנתונים מובְנים להוספה מתקדמת של אתרים לאינדקס

אם הפעלתם את האפשרות 'יצירת אינדקס מתקדמת של אתרים' במאגר הנתונים, תוכלו להשתמש בסוגים הבאים של נתונים מובְנים כדי להעשיר את יצירת האינדקס:

בדף הזה מוסבר על שני סוגי הנתונים המובְנים האלה לדפי אינטרנט, ומתואר בו איך להוסיף מאפיינים מובְנים בהתאמה אישית לסכימה של מאגר הנתונים.

מידע על תאריכים מוגדרים מראש של דפים, שנקבעו על ידי Google

כש-Google סורקת את דפי האינטרנט במאגר נתוני האתר שלכם, היא מסיקה את נתוני הדף באמצעות המאפיינים שרלוונטיים לתוכן. חיפוש מבוסס סוכנים מוסיף את מאפייני הנתונים המשוערים האלה של הדף לסכימה שלכם. הנתונים המשוערים האלה כוללים את מאפייני התאריך המוגדרים מראש הבאים, שנקראים גם תאריכים בכותרת המשנה:

  • datePublished: התאריך והשעה שבהם הדף פורסם לראשונה
  • dateModified: התאריך והשעה שבהם הדף שונה לאחרונה

המאפיינים האלה נוספים לאינדקס באופן אוטומטי. אתם יכולים להשתמש ישירות במאפייני התאריך האלה כדי להעשיר את החיפוש בלי להוסיף אותם לסכימה. כדי להוסיף תאריכים של שורת הקרדיט לאתר, אפשר לעיין במאמר בנושא השפעה על התאריכים של שורת הקרדיט בחיפוש Google.

כדי להבין איך לכלול את מאפייני התאריך המוגדרים מראש האלה בבקשות החיפוש, למשל בביטויי סינון ובמפרטי הגברה, אפשר לעיין בתרחיש לדוגמה לשימוש בתאריך דף שזוהה על ידי Google.

מידע על שדות מותאמים אישית של תאריך ושעה בדף אינטרנט

אתם יכולים להוסיף שדות של תאריך ושעה בהתאמה אישית לדפי האינטרנט שלכם. אפשר להשתמש בתגים כאלה עם יצירת אינדקס מתקדם כשמוסיפים מאפיינים מותאמים אישית של נתונים מובְנים לסכמת מאגר הנתונים. הנה דוגמה שמראה איפה צריך להוסיף מטא-תג מותאם אישית של תאריך ושעה בשם lastModified בדף האינטרנט.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Agent Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

כדי להבין איך לכלול תגי תאריך ושעה מותאמים אישית כאלה בבקשות חיפוש, למשל בביטויי סינון ובמפרטי הגברה, אפשר לעיין בתרחיש לדוגמה לשימוש במאפיין מותאם אישית של תאריך ושעה.

מידע על מאפיינים מותאמים אישית של נתונים מובְנים

אתם יכולים להוסיף מאפיינים של נתונים מובְנים כתגי meta ו-PageMap לדפי האינטרנט שלכם ולהשתמש בהם כדי להעשיר את האינדוקס. כדי להשתמש במאפיינים מובנים בהתאמה אישית לאינדוקס, צריך לעדכן את הסכימה.

תרחיש לדוגמה לשימוש בתגי meta

נניח שיש לכם מספר גדול של דפי אינטרנט שרלוונטיים למחלקות שונות בארגון. אפשר להשתמש בתגי meta כדי לתייג את הדפים שרלוונטיים לכל מחלקה. לאחר מכן תוכלו להשתמש בתגים שעברו אינדוקס כמסננים בשאילתות. כך אפשר להגביל את תוצאות החיפוש לדפי אינטרנט שמכילים תווית שתואמת לאחת מהמחלקות שצוינו.

אפשר לסכם את התהליך כך:

  1. מוסיפים את התגים הבאים meta לקבוצת משנה של דפי האינטרנט:

    • רלוונטי למחלקות הנדסה ו-IT:

      <meta name="department" content="eng, infotech">
      <meta property="og:title" content="Password best practices">
      
    • רלוונטי למחלקות הכספים ומשאבי האנוש:

      <meta name="department" content="finance, human resources">
      <meta property="og:image" content="https://example.com/images/team-training-contractors.jpg">
      

      דוגמה מפורטת יותר זמינה במאמר דוגמה לתגי meta בדף אינטרנט.

  2. סריקה מחדש של הדפים המעודכנים.

  3. מוסיפים את department לסכימת מאגר הנתונים כמערך שאפשר ליצור לו אינדקס, כמו שמתואר בקטע הוספת מאפיינים מותאמים אישית של נתונים מובְנים לסכימת מאגר הנתונים.

אחרי שתעדכנו את הסכימה, מאגר הנתונים שלכם יאונדקס מחדש באופן אוטומטי. אחרי שהאינדוקס מחדש מסתיים, אפשר להשתמש במסנן department בביטוי מסנן כדי לסדר מחדש או לסנן את תוצאות החיפוש. לדוגמה, כשמשתמשים ממחלקת הכספים מזינים שאילתות, אפשר להגדיר את department המסנן לערך finance כדי שתוצאות החיפוש יהיו רלוונטיות יותר עבורם.

דוגמה לתגי meta בדף אינטרנט

דוגמה לתגי meta שאפשר להוסיף לדף אינטרנט. אפשר להשתמש בתגים כאלה עם אינדוקס מתקדם כשמוסיפים מאפיינים מותאמים אישית של נתונים מובְנים לסכמת מאגר הנתונים.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Agent Search. -->
    <meta name="robots" content="index,follow">

    <!-- Agent Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Agent Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Agent Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

תרחיש שימוש לדוגמה ב-PageMaps

נניח שיש לכם כמה דפי אינטרנט שמכילים מתכוני אוכל. אפשר להוסיף נתוני PageMap לתוכן ה-HTML של כל דף. אחר כך תוכלו להשתמש בשמות המאפיינים של PageMap שנוספו לאינדקס כמסננים בשאילתות. לדוגמה, אם אתם רוצים להעלות או להוריד דפים של מתכונים בהתאם לדירוגים שלהם, אתם יכולים לפעול לפי התהליך הבא:

  1. מוסיפים לדפי האינטרנט נתוני PageMap שדומים לנתונים הבאים:

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. סריקה מחדש של הדפים המעודכנים.

  3. מוסיפים את rating לסכימת מאגר הנתונים כמערך שאפשר ליצור לו אינדקס, כמו שמתואר בקטע הוספת מאפייני נתונים מובְנים מותאמים אישית לסכימת מאגר הנתונים.

אחרי שתעדכנו את הסכימה, מאגר הנתונים שלכם יאונדקס מחדש באופן אוטומטי. אחרי שהאינדוקס יסתיים, תוכלו להשתמש במאפיין rating בביטוי מסנן כדי לסדר מחדש או לסנן את תוצאות החיפוש. לדוגמה, כשמשתמשים מחפשים מתכונים, אפשר להשתמש ב-rating בתור מאפיין מספרי מותאם אישית כדי להציג בראש תוצאות החיפוש את המתכונים שקיבלו את הדירוג הכי גבוה.

תרחיש שימוש לדוגמה בנתוני schema.org

נניח שיש לכם אתר לביקורות, ודפי האינטרנט שלו מסומנים בנתוני schema.org בפורמט JSON-LD בתוך התג script HTML. לאחר מכן תוכלו להשתמש בהערות המאונדקסות כמסננים בשאילתות. לדוגמה, אם אתם רוצים להעלות או להוריד את הדירוג של דפי אינטרנט בהתאם לדירוגים המצטברים, אתם יכולים לפעול לפי התהליך הבא:

  1. מוסיפים לדפי האינטרנט את ההערות של schema.org לתוכן ביקורת, בדומה לדוגמה הבאה. כדי לראות סוגים אחרים של תבניות schema.org שזמינות, אפשר לעיין במאמר בנושא סכימות.

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. סריקה מחדש של הדפים המעודכנים.

  3. מוסיפים את הנתיב אל ratingValue לסכימת מאגר הנתונים. משתמשים במזהה כשם השדה בסכימת מאגר הנתונים, כמו rating_value, כפי שמתואר בקטע הוספת מאפיינים מותאמים אישית של נתונים מובְנים לסכימת מאגר הנתונים.

אחרי שתעדכנו את הסכימה, מאגר הנתונים שלכם יאונדקס מחדש באופן אוטומטי. אחרי שהאינדוקס יסתיים, תוכלו להשתמש במאפיין rating_value בביטוי מסנן כדי לסדר מחדש או לסנן את תוצאות החיפוש. לדוגמה, כשמשתמשים מחפשים ספרים, אפשר להשתמש ב-rating_value כמאפיין מספרי מותאם אישית כדי להעלות את תוצאות החיפוש של הספרים שקיבלו את הדירוג הכי גבוה.

לפני שמתחילים

לפני שמעדכנים את הסכימה של מאגר הנתונים, צריך:

הוספת מאפיינים מותאמים אישית של נתונים מובְנים לסכימת מאגר הנתונים

כדי להוסיף מאפיינים מותאמים אישית של נתונים מובְנים לסכימת מאגר הנתונים:

  1. מוסיפים תגי meta, נתוני PageMap ונתוני schema.org לדפים באתר שרוצים להעשיר באמצעות יצירת אינדקס של נתונים מובְנים:

    • אם משתמשים בתגי meta:

    • לנתוני PageMap:

      • נתוני PageMap צריכים לכלול אובייקטים מוכרים של נתונים שמכילים שמות של מאפיינים שרוצים להוסיף לאינדקס. שמות המאפיינים ב-DataObjects צריכים להיות מוגדרים לשדה שרוצים ליצור לו אינדקס.
    • לנתונים של schema.org:

      • ההערות צריכות להיות בפורמט JSON-LD, מיקרו נתונים או RDFa תקין. מידע נוסף זמין במאמר בנושא פורמטים נתמכים.
  2. סריקה מחדש של דפי האינטרנט המעודכנים.

  3. כאן אפשר לראות את הגדרת הסכימה של מאגר הנתונים שלכם ב-API בארכיטקטורת REST.

  4. מעדכנים את הסכימה של מאגר הנתונים באמצעות Google Cloud מסוף או ה-API. אם בוחרים לעשות את זה דרך ה-API, כדאי לקרוא איך מספקים סכימה משלכם כאובייקט JSON.

    1. מוסיפים אובייקטים לכל מאפיין מותאם אישית שרוצים שיהיה ניתן לחפש, לאחזר או ליצור לו אינדקס.

    2. מוסיפים את המאפיין המותאם אישית ומגדירים את הערך type שלו ל-array.

    3. מוסיפים את סוג הנתונים של ערך המאפיין המותאם אישית.

    4. מציינים את המקור של המאפיין המותאם אישית שבו הוא מופיע בשדה siteSearchStructuredDataSources.

    5. לנתוני schema.org: מציינים את הנתיב של המאפיין בהערה של schema.org, החל מהמחרוזת _root בשדה siteSearchSchemaOrgPaths.

    הנה דוגמה לעדכון סכימה באתר:

    {
      "type": "object",
      "properties": {
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchMetatagName": "METATAG_NAME",
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        },
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      },
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    מחליפים את מה שכתוב בשדות הבאים:

    • CUSTOM_ATTRIBUTE: הערך של מאפיין name. לדוגמה:

      • אם תג meta מוגדר כ-<meta name="department" content="eng, infotech">, צריך להשתמש ב-department
      • אם מאפיין PageMap מוגדר כ-<Attribute name="rating">4.9</Attribute>, צריך להשתמש ב-rating
    • DATA_TYPE: סוג הנתונים של מאפיין name. הערך חייב להיות מחרוזת, מספר או תאריך ושעה. לדוגמה:

      • עבור תג meta שמוגדר כ-<meta name="department" content="eng, infotech">, משתמשים ב-string
      • אם מאפיין PageMap מוגדר כ-<Attribute name="rating">4.9</Attribute>, צריך להשתמש ב-number
      • אם מאפיין PageMap מוגדר כ-<Attribute name="lastPublished">2015-01-01</Attribute>, צריך להשתמש ב-datetime

      מידע נוסף זמין במאמר FieldType.

    • METATAG_NAME: הערך של השדה siteSearchMetatagName, שמאפשר לכם לציין את השם המדויק של תג meta מדף האינטרנט.

      צריך להשתמש בפתרון העקיף siteSearchMetatagName רק בתרחישים הבאים:

      • המאפיין name של התג meta מכיל תווים מיוחדים (כמו נקודתיים) ולא תואם לדפוס הנדרש של CUSTOM_ATTRIBUTE, שהוא [a-zA-Z0-9][a-zA-Z0-9-_]*.

      לדוגמה, אם יש לכם תג <meta name="og:updated_time">, אתם לא יכולים להשתמש בתג og:updated_time כ-CUSTOM_ATTRIBUTE. במקום זאת, צריך להשתמש במזהה תואם ל-CUSTOM_ATTRIBUTE (למשל og_updated_time) ואז להגדיר את הערך של siteSearchMetatagName ל-og:updated_time.

      לדוגמה, אם יש לכם תג <meta name="description">, אתם לא יכולים להשתמש בתג description כ-CUSTOM_ATTRIBUTE. במקום זאת, צריך להשתמש במזהה תואם ל-CUSTOM_ATTRIBUTE (למשל meta_tag_description) ואז להגדיר את הערך של siteSearchMetatagName ל-meta_tag_description.

      כשמשתמשים ב-siteSearchMetatagName כדי לעדכן את הסכימה, צריך להשתמש בנקודת הקצה v1alpha במקום בנקודת הקצה v1 כדי לקרוא לשיטה schema.

    • STRUCTURED_DATA_SOURCE_N: מערך שכולל אחד או את שני מקורות הנתונים המובְנים הבאים, שבהם אפשר למצוא את מאפיין CUSTOM_ATTRIBUTE:

      • אם המאפיין המותאם אישית מופיע כתג meta, מציינים METATAGS
      • אם המאפיין המותאם אישית נמצא כמאפיין PageMap, מציינים PAGEMAP
      • אם אפשר למצוא את המאפיין המותאם אישית כנתון של schema.org, מציינים SCHEMA_ORG
      • אם השדה siteSearchStructuredDataSources לא מופיע או שהוא ריק, הערכים מכל שלושת מקורות הנתונים משולבים במערך.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: מזהה מותאם אישית לציון השדה schema.org. השם לא צריך להיות זהה בדיוק לשם השדה בהערה של schema.org בדף האינטרנט. לדוגמה, אם הנתיב של השדה הוא _root.nutrition.calories, המזהה יכול להיות calorific_value או nutrition_value.

    • DATA_TYPE_SCHEMA_ORG_FIELD: סוג הנתונים של השדה schema.org. הערך חייב להיות מחרוזת, מספר או תאריך ושעה. לדוגמה:

      • בשדה schema.org שמוגדר כ-"calories":"240 calories", משתמשים ב-string
      • לשדה schema.org שמוגדר כ-'calories': 240, צריך להשתמש ב-number
      • בשדה schema.org שמוגדר כ-foundingDate:‏ "1991-05-01",‏ משתמשים ב-datetime

      מידע נוסף זמין במאמר FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: הנתיב לשדה יחיד בשדה schema.org שצריך לגשת אליו. הוא מצוין באמצעות נקודות להפרדה אחרי כל רמה מקוננת. צריך לציין את הנתיב המלא שנדרש כדי לגשת לשדה החובה. לדוגמה, אם השדה ratingValue מוטמע בשדה aggregateRating, אפשר לציין את הנתיב כ-_root.aggregateRating.ratingValue.

אחרי שמעדכנים את סכימת האתר, האתר עובר אינדוקס מחדש באופן אוטומטי. זו פעולה ממושכת שיכולה להימשך כמה שעות.

המאמרים הבאים

אפשר להשתמש במטא-נתונים שעברו אינדוקס למטרות הבאות: