Usar dados estruturados para indexação avançada de sites

Se a indexação avançada de sites estiver ativada no seu repositório de dados, você poderá usar os seguintes tipos de dados estruturados para enriquecer a indexação:

Esta página apresenta esses dois tipos de dados estruturados para suas páginas da Web e descreve como adicionar atributos estruturados personalizados ao esquema do repositório de dados.

Sobre as datas de páginas predefinidas e inferidas pelo Google

Ao rastrear as páginas da Web no repositório de dados do seu site, o Google infere dados da página usando as propriedades aplicáveis ao conteúdo. A Pesquisa do agente adiciona essas propriedades de dados de páginas inferidas ao seu esquema. Esses dados inferidos incluem as seguintes propriedades de data predefinidas, que também são chamadas de datas de autoria:

  • datePublished: a data e hora em que a página foi publicada pela primeira vez
  • dateModified: a data e hora em que a página foi modificada mais recentemente

Essas propriedades são indexadas automaticamente. Você pode usar essas propriedades de data diretamente para enriquecer sua pesquisa sem adicioná-las ao esquema. Para adicionar datas de autoria ao seu site, consulte Influenciar suas datas de autoria na Pesquisa Google.

Para entender como incluir essas propriedades de data predefinidas nas suas solicitações de pesquisa, como em expressões de filtro e especificações de aprimoramento, consulte Exemplo de caso de uso com uma data de página inferida pelo Google.

Sobre campos de data e hora personalizados em uma página da Web

Você pode adicionar campos de data e hora personalizados às suas páginas da Web. Essas tags podem ser usadas com a indexação avançada ao adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados. Confira um exemplo que mostra onde adicionar uma metatag de data e hora personalizada chamada lastModified na sua página da Web.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Agent Search can use this date. -->
    <meta name="lastModified" content="2022-07-01">
</head>
<body>
    </body>
</html>

Para entender como incluir essas tags de data e hora personalizadas nas suas solicitações de pesquisa, como em expressões de filtro e especificações de aprimoramento, consulte Exemplo de caso de uso com um atributo de data e hora personalizado.

Sobre atributos de dados estruturados personalizados

Você pode adicionar atributos de dados estruturados como tags meta e PageMaps às suas páginas da Web e usá-los para enriquecer a indexação. Para usar atributos estruturados personalizados na indexação, atualize o esquema.

Exemplo de caso de uso para tags meta

Suponha que você tenha um grande número de páginas da Web relevantes para vários departamentos da sua organização. Você pode usar tags meta para identificar as páginas relevantes para cada departamento. Em seguida, use as tags indexadas como filtros nas consultas. Isso permite restringir os resultados da pesquisa a páginas da Web que contenham um rótulo correspondente a qualquer um dos departamentos especificados.

Esse processo pode ser resumido da seguinte maneira:

  1. Adicione as seguintes tags meta a um subconjunto das suas páginas da Web:

    • Relevante para os departamentos de engenharia e TI:

      <meta name="department" content="eng, infotech">
      <meta property="og:title" content="Password best practices">
      
    • Relevante para os departamentos de finanças e RH:

      <meta name="department" content="finance, human resources">
      <meta property="og:image" content="https://example.com/images/team-training-contractors.jpg">
      

      Para um exemplo mais elaborado, consulte Exemplo de tags em uma página da Web.meta

  2. Rastreie novamente as páginas atualizadas.

  3. Adicione department ao esquema do repositório de dados como uma matriz indexável, conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.

Depois de atualizar o esquema, o repositório de dados será reindexado automaticamente. Após a conclusão da reindexação, você poderá usar o filtro department em uma expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os usuários do departamento financeiro fazem consultas, os resultados da pesquisa podem ser mais relevantes para eles com o department filtro definido como finance.

Exemplo de tags meta em uma página da Web

Confira um exemplo das tags meta que você pode adicionar à sua página da Web. Essas tags podem ser usadas com a indexação avançada quando você adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Your web page title</title>

    <!-- Robots instructions for crawlers and for Agent Search. -->
    <meta name="robots" content="index,follow">

    <!-- Agent Search can use custom datetime fields to filter, boost, and order. -->
    <meta name="lastModified" content="2024-09-06">

    <!-- Agent Search can filter by category or tags. -->
    <meta name="category" content="archived">
    <meta name="tags" content="legacy,interesting,faq">

    <!-- Agent Search can index these common HTML tags. -->
    <meta name="description" content="A description of your web page's content.">
    <meta name="author" content="Your name or organization">
    <meta name="keywords" content="relevant,keywords,separated,by,commas">
    <link rel="canonical" href="https://www.yourwebsite.com/this-page">
    <meta property="og:title" content="Your Webpage Title">
    <meta property="og:description" content="A description of your webpage's content.">
    <meta property="og:image" content="https://www.yourwebsite.com/image.jpg">
    <meta property="og:url" content="https://www.yourwebsite.com/this-page">
    <meta property="og:type" content="website">
    <meta name="twitter:card" content="summary_large_image">
    <meta name="twitter:title" content="Your customized Webpage Title">
    <meta name="twitter:description" content="A description of your webpage's content.">
    <meta name="twitter:image" content="https://www.yourwebsite.com/image.jpg">
</head>
<body>
...
</body>
</html>

Exemplo de caso de uso para PageMaps

Suponha que você tenha várias páginas da Web que contenham receitas de comida. Você pode adicionar dados do PageMap ao conteúdo HTML de cada página. Em seguida, use os nomes de atributos do PageMap indexados como filtros nas consultas. Por exemplo, se você pretende aprimorar ou ocultar páginas da Web dependendo das classificações de receitas, siga este processo:

  1. Adicione dados do PageMap semelhantes aos seguintes às suas páginas da Web:

    <html>
    <head>
    ...
    <!--
    <PageMap>
        <DataObject type="document">
            <Attribute name="title">Baked potatoes</Attribute>
            <Attribute name="author">Dana A.</Attribute>
            <Attribute name="description">Homestyle baked potatoes in oven. This
            recipe uses Russet potatoes.</Attribute>
            <Attribute name="rating">4.9</Attribute>
            <Attribute name="lastUpdate">2015-01-01</Attribute>
        </DataObject>
    </PageMap>
    -->
    </head>
    ...
    </html>
    
  2. Rastreie novamente as páginas atualizadas.

  3. Adicione rating ao esquema do repositório de dados como uma matriz indexável, conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.

Depois de atualizar o esquema, o repositório de dados será reindexado automaticamente. Após a conclusão da reindexação, você poderá usar o atributo rating em uma expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os usuários pesquisam receitas, aprimore os resultados da pesquisa mais bem classificados usando rating como um atributo numérico personalizado.

Exemplo de caso de uso para dados do schema.org

Suponha que você tenha um site de avaliações e que as páginas da Web dele sejam anotadas com dados do schema.org no formato JSON-LD na tag script HTML. Em seguida, use as anotações indexadas como filtros nas consultas. Por exemplo, se você pretende aprimorar ou ocultar páginas da Web dependendo das classificações agregadas, siga este processo:

  1. Adicione as anotações do schema.org para conteúdo de avaliação semelhante a o seguinte às suas páginas da Web. Para conferir outros tipos de modelos do schema.org disponíveis, consulte Esquemas:

    <script type="application/ld+json">
    {
      "@context": "https://schema.org",
      "@type": "Review",
      "aggregateRating": {
        "@type": "Average Rating",
        "ratingValue": 3.5,
        "reviewCount": 11
      },
      "description": "Published in 1843, this is the perfect depiction of the Victorian London. A Christmas Carol is the story of Ebenezer Scrooge's transformation.",
      "name": "A Christmas Carol",
      "image": "christmas-carol-first-ed.jpg",
      "review": [
        {
          "@type": "Review",
          "author": "Alex T.",
          "datePublished": "2000-01-01",
          "reviewBody": "Read this in middle school and have loved this ever since.",
          "name": "Worth all the adaptations",
          "reviewRating": {
            "@type": "Rating",
            "bestRating": 5,
            "ratingValue": 5,
            "worstRating": 1
          }
        }
      ]
    }
    </script>
    
  2. Rastreie novamente as páginas atualizadas.

  3. Adicione o caminho para ratingValue ao esquema do repositório de dados. Use um identificador como o nome do campo no esquema do repositório de dados, como rating_value conforme descrito na seção Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados.

Depois de atualizar o esquema, o repositório de dados será reindexado automaticamente. Após a conclusão da reindexação, você poderá usar o atributo rating_value em uma expressão de filtro para reordenar ou filtrar os resultados da pesquisa. Por exemplo, quando os usuários pesquisam livros, aprimore os resultados da pesquisa mais bem classificados usando rating_value como um atributo numérico personalizado.

Antes de começar

Antes de atualizar o esquema do repositório de dados, faça o seguinte:

Adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados

Para adicionar atributos de dados estruturados personalizados ao esquema do repositório de dados:

  1. Adicione tags meta, dados do PageMap e dados do schema.org às páginas do seu site que você quer enriquecer com a indexação de dados estruturados:

  2. Rastreie novamente as páginas da Web atualizadas.

  3. Consulte a definição de esquema do seu repositório de dados na API REST.

  4. Atualize o esquema do repositório de dados usando Google Cloud o console ou a API. Se você optar por fazer isso pela API, saiba como fornecer seu próprio esquema como um objeto JSON.

    1. Adicione objetos para cada atributo personalizado que você quer tornar pesquisável, recuperável ou indexável.

    2. Adicione o atributo personalizado e defina o type como array.

    3. Adicione o tipo de dados do valor do atributo personalizado.

    4. Especifique a origem do atributo personalizado em que ele pode ser encontrado no campo siteSearchStructuredDataSources.

    5. Para dados do schema.org: especifique o caminho do atributo na anotação do schema.org começando com a string _root no campo siteSearchSchemaOrgPaths.

    Confira a seguir um exemplo de atualização de esquema para um site:

    {
      "type": "object",
      "properties": {
        "CUSTOM_ATTRIBUTE": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchMetatagName": "METATAG_NAME",
            "siteSearchStructuredDataSources": ["STRUCTURED_DATA_SOURCE_1", "STRUCTURED_DATA_SOURCE_2"]
          }
        },
        "IDENTIFIER_FOR_SCHEMA_ORG_FIELD": {
          "type": "array",
          "items": {
            "type": "DATA_TYPE_SCHEMA_ORG_FIELD",
            "searchable": true,
            "retrievable": true,
            "indexable": true,
            "siteSearchSchemaOrgPaths": ["_root.PATH_TO_THE_SCHEMA_ORG_FIELD"]
          }
        }
      },
      "$schema": "https://json-schema.org/draft/2020-12/schema"
    }

    Substitua:

    • CUSTOM_ATTRIBUTE: o valor do atributo name. Exemplo:

      • Para uma tag meta definida como <meta name="department" content="eng, infotech">, use department
      • Para um atributo do PageMap definido como <Attribute name="rating">4.9</Attribute>, use rating
    • DATA_TYPE: o tipo de dados do atributo name. Precisa ser string, número ou data e hora. Exemplo:

      • Para uma tag meta definida como <meta name="department" content="eng, infotech">, use string
      • Para um atributo do PageMap definido como <Attribute name="rating">4.9</Attribute>, use number
      • Para um atributo do PageMap definido como <Attribute name="lastPublished">2015-01-01</Attribute>, use datetime

      Para mais informações, consulte FieldType.

    • METATAG_NAME: o valor do campo siteSearchMetatagName, que permite especificar o nome exato de uma tag meta da sua página da Web.

      Você só precisa usar a solução alternativa siteSearchMetatagName nos seguintes cenários:

      • O atributo name da tag meta contém caracteres especiais (como dois pontos) e não corresponde ao padrão necessário para CUSTOM_ATTRIBUTE, que é [a-zA-Z0-9][a-zA-Z0-9-_]*.

      Por exemplo, se você tiver uma tag <meta name="og:updated_time">, então, não poderá usar og:updated_time como um CUSTOM_ATTRIBUTE. Em vez disso, use um identificador compatível para CUSTOM_ATTRIBUTE (como og_updated_time) e defina o valor de siteSearchMetatagName como og:updated_time.

      Por exemplo, se você tiver uma tag <meta name="description">, então, não poderá usar description como um CUSTOM_ATTRIBUTE. Em vez disso, use um identificador compatível para CUSTOM_ATTRIBUTE (como meta_tag_description) e defina o valor de siteSearchMetatagName como meta_tag_description.

      Ao usar siteSearchMetatagName para atualizar o esquema, use o endpoint v1alpha em vez do endpoint v1 para chamar o schema método.

    • STRUCTURED_DATA_SOURCE_N: uma matriz que consiste em uma ou ambas as seguintes fontes de dados estruturados em que o atributo CUSTOM_ATTRIBUTE pode ser encontrado:

      • Se o atributo personalizado puder ser encontrado como uma tag meta, especifique METATAGS
      • Se o atributo personalizado puder ser encontrado como um atributo do PageMap, especifique PAGEMAP
      • Se o atributo personalizado puder ser encontrado como um dado do schema.org, especifique SCHEMA_ORG
      • Se o campo siteSearchStructuredDataSources estiver ausente ou vazio, os valores de todas as três fontes de dados serão mesclados em uma matriz.
    • IDENTIFIER_FOR_SCHEMA_ORG_FIELD: um identificador personalizado para indicar o campo do schema.org. Ele não precisa ser exatamente igual ao nome do campo na anotação do schema.org na sua página da Web. Por exemplo, se o caminho do campo for _root.nutrition.calories, o identificador poderá ser calorific_value ou nutrition_value.

    • DATA_TYPE_SCHEMA_ORG_FIELD: o tipo de dados do campo do schema.org. Precisa ser string, número ou data e hora. Exemplo:

      • Para um campo do schema.org definido como "calories":"240 calories", use string
      • Para um campo do schema.org definido como "calories": 240, use number
      • Para um campo do schema.org definido como "foundingDate": "1991-05-01", use datetime

      Para mais informações, consulte FieldType.

    • PATH_TO_THE_SCHEMA_ORG_FIELD: o caminho para um único campo no campo do schema.org que precisa ser acessado. Ele é especificado usando separadores de ponto após cada nível aninhado. Você precisa especificar o caminho completo necessário para acessar o campo obrigatório. Por exemplo, se um campo ratingValue estiver aninhado no campo aggregateRating, você poderá especificar o caminho como _root.aggregateRating.ratingValue.

Depois de atualizar o esquema do site, ele será reindexado automaticamente. Essa é uma operação de longa duração que pode levar várias horas.

A seguir

Use os metadados indexados para o seguinte: