Utiliser des données structurées pour l'indexation avancée de sites Web

Si l'indexation avancée de sites Web est activée dans votre data store, vous pouvez utiliser les types de données structurées suivants pour enrichir votre indexation :

Cette page présente ces deux types de données structurées pour vos pages Web et explique comment ajouter des attributs structurés personnalisés au schéma de votre data store.

À propos des dates de page prédéfinies et déduites par Google

Lors de l'exploration des pages Web de votre data store de site Web, Google déduit les données de la page à l'aide des propriétés qui s'appliquent à votre contenu. La recherche d'agent ajoute ces propriétés de données de page déduites à votre schéma. Ces données déduites incluent les propriétés de date prédéfinies suivantes, également appelées dates de publication :

  • datePublished : date et heure de publication initiale de la page
  • dateModified : date et heure de la dernière modification de la page

Ces propriétés sont indexées automatiquement. Vous pouvez utiliser directement ces propriétés de date pour enrichir votre recherche sans les ajouter à votre schéma. Pour ajouter des dates de publication à votre site Web, consultez Influencer vos dates de publication dans la recherche Google.

Pour savoir comment inclure ces propriétés de date prédéfinies dans vos requêtes de recherche, par exemple dans des expressions de filtre et des spécifications de boost, consultez Exemple de cas d'utilisation avec une date de page déduite par Google.

À propos des champs de date et d'heure personnalisés sur une page Web

Vous pouvez ajouter des champs de date et d'heure personnalisés à vos pages Web. Ces balises peuvent être utilisées avec l'indexation avancée lorsque vous ajoutez des attributs de données structurées personnalisés au data store datastore. Voici un exemple qui montre où ajouter une balise Meta de date et d'heure personnalisée nommée lastModified sur votre page Web.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Agent Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

Pour savoir comment inclure ces balises de date et d'heure personnalisées dans vos requêtes de recherche, par exemple dans des expressions de filtre et des spécifications de boost, consultez Exemple de cas d'utilisation avec un attribut de date et d'heure personnalisé.

À propos des attributs de données structurées personnalisés

Vous pouvez ajouter des attributs de données structurées sous forme de balises meta et de PageMaps à vos pages Web, et les utiliser pour enrichir votre indexation. Pour utiliser des attributs structurés personnalisés pour l'indexation, vous devez mettre à jour votre schéma.

Exemple de cas d'utilisation pour les balises meta

Supposons que vous ayez un grand nombre de pages Web qui concernent différents services de votre organisation. Vous pouvez utiliser des balises meta pour étiqueter les pages qui concernent chaque service. Vous pouvez ensuite utiliser les balises indexées comme filtres dans vos requêtes. Cela vous permet de limiter les résultats de recherche aux pages Web contenant une étiquette qui correspond à l'un des services spécifiés.

Ce processus peut être résumé comme suit :

  1. Ajoutez les balises meta suivantes à un sous-ensemble de vos pages Web :

    • Pour les services d'ingénierie et informatique :

      <meta name="department" content="eng, infotech">
      <meta property="og:title" content="Password best practices">
      
    • Pour les services des finances et des ressources humaines :

      <meta name="department" content="finance, human resources">
      <meta property="og:image" content="https://example.com/images/team-training-contractors.jpg">
      

      Pour obtenir un exemple plus élaboré, consultez Exemple de balises meta sur une page Web.

  2. Réexplorez les pages mises à jour.

  3. Ajoutez department à votre schéma de data store en tant que tableau indexable, comme décrit dans la section Ajouter des attributs de données structurées personnalisés au data store datastore.

Une fois votre schéma mis à jour, votre data store est automatiquement réindexé. Une fois la réindexation terminée, vous pouvez utiliser le department filtre dans une expression de filtre pour réorganiser ou filtrer les résultats de recherche. Par exemple, lorsque les utilisateurs du service des finances envoient des requêtes, les résultats de recherche peuvent être plus pertinents pour eux si le department filtre est défini sur finance.

Exemple de balises meta sur une page Web

Voici un exemple de balises meta que vous pouvez ajouter à votre page Web. Ces balises peuvent être utilisées avec l'indexation avancée lorsque vous ajoutez des attributs de données structurées personnalisés au data store datastore.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Agent Search. -->
    <meta name="robots" content="index,follow">

    <!-- Agent Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Agent Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Agent Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

Exemple de cas d'utilisation pour PageMaps

Supposons que vous ayez plusieurs pages Web contenant des recettes de cuisine. Vous pouvez ajouter des données PageMaps au contenu HTML de chaque page. Vous pouvez ensuite utiliser les noms d'attributs PageMaps indexés comme filtres dans vos requêtes. Par exemple, si vous souhaitez mettre en avant ou masquer des pages Web en fonction des notes des recettes, vous pouvez suivre ce processus :

  1. Ajoutez des données PageMaps semblables à celles ci-dessous à vos pages Web :

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. Réexplorez les pages mises à jour.

  3. Ajoutez rating à votre schéma de data store en tant que tableau indexable, comme décrit dans la section Ajouter des attributs de données structurées personnalisés au schéma data store datastore.

Une fois votre schéma mis à jour, votre data store est automatiquement réindexé. Une fois la réindexation terminée, vous pouvez utiliser l'attribut rating dans une expression de filtre pour réorganiser ou filtrer les résultats de recherche. Par exemple, lorsque les utilisateurs recherchent des recettes, mettez en avant les résultats de recherche les mieux notés en utilisant rating comme attribut numérique personnalisé.

Exemple de cas d'utilisation pour les données schema.org

Supposons que vous ayez un site Web d'avis et que ses pages Web soient annotées avec des données schema.org au format JSON-LD dans la balise HTML script. Vous pouvez ensuite utiliser les annotations indexées comme filtres dans vos requêtes. Par exemple, si vous souhaitez mettre en avant ou masquer des pages Web en fonction des notes agrégées, vous pouvez suivre ce processus :

  1. Ajoutez les annotations schema.org pour le contenu d'avis semblables à celles ci-dessous à vos pages Web. Pour afficher d'autres types de modèles schema.org disponibles, consultez Schémas :

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. Réexplorez les pages mises à jour.

  3. Ajoutez le chemin d'accès à ratingValue à votre schéma de data store. Utilisez un identifiant comme nom de champ dans le schéma du data store, tel que rating_value comme décrit dans la section Ajouter des attributs de données structurées personnalisés au schéma du datastore.

Une fois votre schéma mis à jour, votre data store est automatiquement réindexé. Une fois la réindexation terminée, vous pouvez utiliser l'attribut rating_value dans une expression de filtre pour réorganiser ou filtrer les résultats de recherche. Par exemple, lorsque les utilisateurs recherchent des livres, mettez en avant les résultats de recherche les mieux notés en utilisant rating_value comme attribut numérique personnalisé.

Avant de commencer

Avant de mettre à jour le schéma du data store, procédez comme suit :

Ajouter des attributs de données structurées personnalisés au schéma du data store

Pour ajouter des attributs de données structurées personnalisés au schéma du data store :

  1. Ajoutez des balises meta, des données PageMaps et des données schema.org aux pages de votre site Web que vous souhaitez enrichir avec l'indexation de données structurées :

    • Pour les balises meta :

    • Pour les données PageMaps :

      • Les données PageMaps doivent être constituées de DataObjects reconnus contenant des noms d'attributs que vous souhaitez indexer. Les noms d'attributs dans les DataObjects doivent être définis sur le champ que vous souhaitez indexer.
    • Pour les données schema.org :

      • Les annotations doivent être au format JSON-LD, Microdata ou RDFa valide. Pour en savoir plus, consultez Formats compatibles.
  2. Réexplorez les pages Web mises à jour.

  3. Affichez la définition du schéma de votre data store via l'API REST.

  4. Mettez à jour le schéma du datastore à l'aide de Google Cloud la console ou de l'API. Si vous choisissez de le faire via l'API, découvrez comment fournir votre propre schéma en tant qu'objet JSON.

    1. Ajoutez des objets pour chaque attribut personnalisé que vous souhaitez rendre consultable, récupérable ou indexable.

    2. Ajoutez l'attribut personnalisé et définissez son type sur array.

    3. Ajoutez le type de données de la valeur de l'attribut personnalisé.

    4. Spécifiez la source de l'attribut personnalisé où il peut être trouvé dans le champ siteSearchStructuredDataSources.

    5. Pour les données schema.org : spécifiez le chemin d'accès de l'attribut dans l'annotation schema.org en commençant par la chaîne _root dans le champ siteSearchSchemaOrgPaths.

    Voici un exemple de mise à jour de schéma pour un site Web :

    {
      "type": "object",
      "properties": {
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchMetatagName": "METATAG_NAME",
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        },
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      },
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    Remplacez les éléments suivants :

    • CUSTOM_ATTRIBUTE : valeur de l'attribut name. Exemple :

      • Pour une balise meta définie comme <meta name="department" content="eng, infotech">, utilisez department
      • Pour un attribut PageMaps défini comme <Attribute name="rating">4.9</Attribute>, utilisez rating
    • DATA_TYPE: type de données de l'attribut name. Doit être une chaîne, un nombre ou une date et une heure. Exemple :

      • Pour une balise meta définie comme <meta name="department" content="eng, infotech">, utilisez string
      • Pour un attribut PageMaps défini comme <Attribute name="rating">4.9</Attribute>, utilisez number
      • Pour un attribut PageMaps défini comme <Attribute name="lastPublished">2015-01-01</Attribute>, utilisez datetime

      Pour en savoir plus, consultez FieldType.

    • METATAG_NAME: valeur du champ siteSearchMetatagName, qui vous permet de spécifier le nom exact d'une balise meta de votre page Web.

      Vous n'avez besoin d'utiliser la solution de contournement siteSearchMetatagName que dans les cas suivants :

      • L'attribut name de la balise meta contient des caractères spéciaux (comme un deux-points) et ne correspond pas au format requis pour CUSTOM_ATTRIBUTE, qui est [a-zA-Z0-9][a-zA-Z0-9-_]*.

      Par exemple, si vous avez une balise <meta name="og:updated_time">, alors, vous ne pouvez pas utiliser og:updated_time comme un CUSTOM_ATTRIBUTE. Vous devez plutôt utiliser un identifiant compatible pour CUSTOM_ATTRIBUTE (comme og_updated_time), puis définir la valeur de siteSearchMetatagName sur og:updated_time.

      Par exemple, si vous avez une balise <meta name="description">, alors, vous ne pouvez pas utiliser description comme CUSTOM_ATTRIBUTE. Vous devez plutôt utiliser un identifiant compatible pour CUSTOM_ATTRIBUTE (comme meta_tag_description), puis définir la valeur de siteSearchMetatagName sur meta_tag_description.

      Lorsque vous utilisez siteSearchMetatagName pour mettre à jour le schéma, vous devez utiliser le point de terminaison v1alpha au lieu du point de terminaison v1 pour appeler la schema méthode.

    • STRUCTURED_DATA_SOURCE_N: tableau composé d'une ou des deux sources de données structurées suivantes où l'attribut CUSTOM_ATTRIBUTE peut être trouvé :

      • Si l'attribut personnalisé se trouve sous forme de balise meta, spécifiez METATAGS.
      • Si l'attribut personnalisé se trouve sous forme d'attribut PageMaps, spécifiez PAGEMAP.
      • Si l'attribut personnalisé se trouve sous forme de données schema.org, spécifiez SCHEMA_ORG.
      • Si le champ siteSearchStructuredDataSources est absent ou vide, les valeurs des trois sources de données sont fusionnées dans un tableau.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: identifiant personnalisé pour désigner le champ schema.org. Il n'a pas besoin d'être exactement identique au nom de champ dans l'annotation schema.org de votre page Web. Par exemple, si le chemin d'accès du champ est _root.nutrition.calories, l'identifiant peut être calorific_value ou nutrition_value.

    • DATA_TYPE_SCHEMA_ORG_FIELD: type de données du champ schema.org. Doit être une chaîne, un nombre ou une date et une heure. Exemple :

      • Pour un champ schema.org défini comme "calories":"240 calories", utilisez string.
      • Pour un champ schema.org défini comme "calories": 240, utilisez number.
      • Pour un champ schema.org défini comme "foundingDate": "1991-05-01", utilisez datetime.

      Pour en savoir plus, consultez FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: chemin d'accès à un seul champ dans le champ schema.org auquel vous devez accéder. Il est spécifié à l'aide de séparateurs de points après chaque niveau imbriqué. Vous devez spécifier le chemin complet nécessaire pour accéder au champ requis. Par exemple, si un champ ratingValue est imbriqué dans le champ aggregateRating, vous pouvez spécifier le chemin d'accès comme _root.aggregateRating.ratingValue.

Une fois le schéma du site Web mis à jour, le site Web est automatiquement réindexé. Il s'agit d'une opération de longue durée qui peut prendre plusieurs heures.

Étape suivante

Utilisez les métadonnées indexées pour les éléments suivants :