Esta página informa as práticas recomendadas para criar informações do catálogo e preencher os dados do catálogo.
Visão geral
O catálogo é um conjunto de objetos de produto.
Os dados do catálogo importados para a Vertex AI Search for commerce têm um efeito direto na qualidade do modelo resultante e, portanto, na qualidade dos resultados de pesquisa e recomendação. Em geral, quanto mais precisas e específicas forem as informações de catálogo que você fornecer, maior será a qualidade do seu modelo.
Seu catálogo precisa estar atualizado. É possível fazer upload das alterações do catálogo quantas vezes forem necessárias. Idealmente, todos os dias para catálogos com uma alta taxa de mudanças. É possível fazer upload (patch) de itens de produto existentes somente os campos alterados serão atualizados. Não há cobrança pelo upload das informações do catálogo. Para mais informações, consulte Como manter seu catálogo atualizado.
Ramificações do catálogo
Ramificações do catálogo com pesquisa
Se você usa a pesquisa, pode usar as ramificações do catálogo para testar novos dados enviados off-line antes de disponibilizá-los no seu site.
É possível usar até três ramificações, identificadas como
0, 1 e 2. Seu site ativo aponta para default_branch para os dados do catálogo. Especifique qual ramificação é a default_branch ativa (o padrão é definido como
ramificação 0) usando setDefaultBranch ou a guia "Dados" no
console de pesquisa para comércio. Em seguida, seu site usa os dados do catálogo fornecidos
pela ramificação para a qual o default_branch aponta.
Por exemplo, digamos que default_branch esteja definido com o ID da ramificação 0. Portanto, seu site está usando os dados do catálogo que você enviou para essa ramificação. Você pode
fazer upload de novos dados de catálogo para a ramificação 1 e visualizá-los. Depois de confirmar
que o catálogo foi enviado corretamente, mude para a ramificação 1 como
a default_branch ativa.
O cache do catálogo pode levar até 30 minutos para ser atualizado após a troca de ramificação.
Se você usa recomendações, use apenas a ramificação padrão devido ao atraso na atualização durante a troca de ramificações. Se a diferença de dados entre as ramificações for grande, o atraso na atualização poderá afetar negativamente os resultados da previsão.
Informações obrigatórias do produto
Os campos a seguir são obrigatórios. É preciso fornecer valores a eles ao criar itens de produtos no catálogo. Eles também precisam corresponder aos valores usados no banco de dados interno do produto e refletir com precisão o produto representado, porque estão incluídos no treinamento dos modelos.
Em alguns casos, outros campos também são obrigatórios. Consulte a lista completa de todos os campos de produtos na página de referência Product.
Todas as informações do produto que você fornece podem ser usadas para melhorar a qualidade das recomendações e dos resultados da pesquisa. Forneça o maior número possível de campos.
| Campo | Observações |
|---|---|
name
|
O nome exclusivo completo do recurso do produto. Obrigatório para todos os métodos
Product, exceto import. Durante a importação, o nome é gerado automaticamente e não precisa ser fornecido manualmente.
|
id
|
O ID do produto usado pelo banco de dados do produto. O campo "ID" precisa ser exclusivo em todo o catálogo. O mesmo valor é usado quando você
registra um evento de usuário e também é retornado pelos métodos predict
e search.
|
title
|
Título do produto do seu banco de dados de produtos. Uma string codificada em UTF-8. Limitado a 1.250 caracteres. |
categories
|
Categorias de produtos. Cada produto precisa ser atribuído a pelo menos uma categoria.
Se um produto pertencer a mais de uma categoria, repita o campo para cada uma delas.
O valor precisa ser uma string não vazia com codificação UTF-8 e um limite de 5.000 caracteres. Sempre especifique o caminho completo da categoria, por exemplo:
["Sports & Fitness > Athletic Clothing > Shoes"].
|
Categorias do catálogo
Esta seção descreve a estrutura do catálogo e como designá-lo para uso em taxonomia e filtragem.
Estrutura do catálogo
O campo categories no catálogo precisa conter o caminho de categoria mais granular para cada produto. As categorias principais não são obrigatórias e não devem ser incluídas.
Veja um exemplo de como estruturar seu catálogo:
- Correta:
categories: ["Flowers, Cards, Occasion > Seasonal Items > Christmas"] - Incorreto:
categories: ["Flowers, Cards, Occasion", "Flowers, Cards, Occasion > Seasonal Items", "Flowers, Cards, Occasion > Seasonal Items > Christmas"]
Categorias principais
As categorias principais de um determinado produto não devem ser incluídas no campo categories. A filtragem para navegação precisa ser feita usando outros atributos personalizados.
Nomeação de categorias
Os nomes das categorias precisam ser escolhidos com cuidado para evitar palavras-chave incorretas e melhorar a performance. Usar termos mais específicos e precisos aumenta a relevância e reduz problemas.
- Recomendado: Alimentos congelados > Frutas congeladas
- Não recomendado: Frutas e legumes congelados > Frutas congeladas
Estrutura específica do projeto no nível do catálogo
Crie um catálogo para cada idioma. Se você opera em vários países, pode usar o mesmo catálogo para fornecer resultados da pesquisa em diferentes locais.
Forneça preços, que são determinados por inventários locais, na mesma moeda em todos os países. Se os preços variarem entre os países, crie um inventário local para cada um deles. Especifique os preços lá.
Para otimizar os resultados da pesquisa, forneça o nome de cada país como SearchRequest.entity e UserEvent.entity. Use entidades de país apenas para fins de classificação.
Estrutura do produto
Ao gerenciar seu catálogo de produtos na Vertex AI Search for commerce, é fundamental entender como os atributos são processados para produtos principais e variantes para uma pesquisa e recomendações eficazes. As designações de SKU de produto determinam a hierarquia do catálogo.

Tipos de designação de produto
Há três tipos de designação de produto:
Os itens principais ou parentes são retornados em recomendações ou resultados de pesquisa e servem como contêineres lógicos ou grupos de itens semelhantes. Os principais podem ser itens individuais (nível da SKU) e grupos de itens semelhantes (grupos da SKU).
Os itens variantes ou secundários são versões específicas e individuais de um produto principal do grupo de SKUs. Por exemplo, se o produto principal for camisa com gola em V,as variantes poderão ser camisa com gola em V marrom, tamanho XL e camisa com gola em V branca, tamanho P.
Os itens de coleção são pacotes de produtos principais ou variantes de produto, como um conjunto de joias com um colar, brincos e um anel. Estruturas hierárquicas semelhantes a produtos e variantes, as coleções agrupam produtos principais relacionados. Os clientes não podem comprar esses anúncios diretamente, eles não são amplamente usados e estão disponíveis apenas na pesquisa.


Hierarquias de classificação de produtos
Usando os três tipos de nível de produto, há três principais hierarquias de classificação de produtos:
- Variante principal: a variante principal quase sempre é apenas um marcador de posição de informações (comuns), e as variantes são os SKUs reais que podem ser comprados. Por exemplo, camisetas seriam melhor estruturadas hierarquicamente, como produtos principais com o conjunto correspondente de variantes. Cada variante representa uma SKU individual (para cada tamanho), e cada item principal representa um grupo de SKUs, em que cada SKU é um tamanho diferente para um estilo geral de camiseta. Essa organização por estrutura de SKU permite que os resultados da pesquisa e os painéis de recomendação mostrem uma variedade de estilos de camisetas. Ele permite que o comprador detalhe um estilo principal específico para selecionar a variante (tamanho) a ser comprada.
- Somente primário: de acordo com esses tipos de designação de produto, os itens de supermercado são mais bem catalogados como produtos principais, cada um consistindo em um único produto de SKU, como
"bananas, fresh". - Coleções: as coleções agrupam produtos relacionados que um cliente pode comprar. Para representá-los com precisão no modelo de reclassificação, a Vertex AI Search for commerce tem uma lógica que os credencia com compras. Por exemplo, um comprador clica em produtos em um conjunto de lençóis e adiciona ao carrinho ou compra um produto principal nessa coleção. A compra é atribuída à coleção, e o modelo representa com precisão a popularidade e o valor das coleções.
Produtos com uma variante
Para produtos que têm uma variante, estruture-os como principal-variante, porque há várias vantagens, incluindo:
- A página de pesquisa tem vários resultados que podem ser mostrados aos usuários finais. Caso contrário, se as variantes fossem tratadas como produtos principais, a página de resultados da pesquisa seria preenchida com os mesmos produtos.
- Os produtos têm um esquema de classificação mais completo, já que os itens principais com variantes são classificados melhor se uma variante específica estiver recebendo mais engajamento. Isso ajuda na reclassificação e na otimização da receita.
- Facilidade de manutenção do catálogo. Se um atributo tiver uma mudança para um grupo de produtos que diferem apenas no tamanho, isso poderá ser feito usando uma estrutura de variante principal, como mudar o atributo no nível principal em vez de mudar vários itens principais.
- Os recursos da API e os campos de resposta da pesquisa de chaves de rollup de variantes e campos recuperáveis são compatíveis apenas com variantes.
- A resposta da pesquisa contém detalhes mínimos da opção principal e mais detalhes das variantes. Por isso, você sempre precisa aumentar ou enriquecer a resposta da pesquisa com detalhes extras, que podem ser retornados pela Vertex AI para Pesquisa para Commerce se forem marcados como recuperáveis.
Configurar seu catálogo de produtos
Ao planejar seu catálogo de produtos, você precisa decidir se ele contém produtos designados como apenas principais, principais e variantes ou uma mistura dos dois arranjos. Pense na estrutura de SKU dos seus produtos. Seus produtos podem ser itens principais, que podem ter variantes.
Com base em como os SKUs dos produtos são designados, considere as opções para configurar o catálogo de produtos:
- Você quer que sua SKU apareça como um resultado de pesquisa ou recomendação individual: SKU=primary
- Sua SKU precisa fazer parte de um grupo de SKUs semelhantes: SKU=variante, grupo de SKUs=principal
- Uma mistura das duas combinações: SKU=primária, SKU=variante, grupo de SKUs=primária

Se a página de detalhes do produto mostrar um seletor de opção, tamanho ou cor, essas opções geralmente são enviadas como variantes para o catálogo de produtos. Considere se você quer que diferentes tipos do mesmo produto com atributos diferentes, como tamanho e cor, apareçam como um único resultado da pesquisa ou separados. Por exemplo, para um livro, você precisa decidir se quer que uma SKU de capa dura e uma de capa flexível do mesmo livro apareçam como resultados de pesquisa separados (SKU = principal) ou como um só (SKU = variante, grupo de SKUs = principal).
Ao configurar seu catálogo de produtos, lembre-se de que as recomendações e os resultados da pesquisa retornam apenas itens principais.
Produtos principais mínimos
Se você determinar que seu catálogo deve ter produtos principais e variantes, ou seja, grupos de SKUs e SKUs, mas só tiver SKUs agora, crie produtos principais para os grupos de SKUs. Às vezes, essas primárias são chamadas de primárias virtuais ou falsas.
Essas chaves precisam conter apenas informações mínimas: id, title e categories.
Se type não for especificado, o tipo de produto será definido como "principal". Se você estiver
importando, não será necessário especificar name. Para mais informações, consulte a seção anterior, Informações obrigatórias do produto.
Importação de catálogo
Se o catálogo estiver no Cloud Storage, no BigQuery ou em outro armazenamento, faça uma importação de dados em massa.
Para informações detalhadas sobre como fazer upload de um catálogo, consulte Importar informações do catálogo.
Correção do URL do produto
O campo product.uri é o URL canônico que leva diretamente à página de detalhes do produto. Ele precisa ser um URI rastreável publicamente e não estar protegido por um login ou autorização. Isso acontece porque o back-end rastreia a página da Web do URI e deriva o máximo de informações possível, que são usadas para pontuação de relevância e popularidade. O back-end também determina como o URI foi usado na Web, incluindo backlinks. Ter o mesmo nome de domínio de nível superior em todos os URIs de produtos.
Se você tiver o mesmo produto listado em vários sites de banner, use o recurso de várias entidades. Entre em contato com a equipe de conta para saber mais.
A Vertex AI para Pesquisa para Commerce usa URLs de produtos para enriquecer as descrições. Se você usar um URL diferente no catálogo de produtos e no site, verifique se os dois URLs se referem ao mesmo produto e têm informações quase idênticas.
Os URLs de produtos melhoram os catálogos ao:
- Enriquecimento de dados de produtos: a Vertex AI Search para e-commerce extrai informações complementares rastreando o URI do produto, o identificador de recurso exclusivo por trás da localização exata de cada produto na Web (URL). Esse processo ajuda a extrair mais detalhes e indicadores das páginas da Web vinculadas. O entendimento mais profundo dos produtos obtido com a rastreamento de URIs contribui diretamente para a qualidade dos dados do catálogo.
- Melhorar a qualidade e a relevância da pesquisa: os sinais da Web coletados dos URIs rastreados são usados para melhorar a qualidade da pesquisa. O back-end usa as informações rastreadas, incluindo como o URI foi usado na Web, como quando o usuário clica em backlinks, para pontuação de relevância e popularidade nos resultados da pesquisa.
- Fornecer uma base para o treinamento do modelo: além do ID do produto, do título, da hierarquia de categoria e do preço, os URLs são considerados um dos principais campos usados como entradas para o treinamento de modelo.
Para maximizar os benefícios dos URLs de produtos, siga estas práticas recomendadas:
- A página da Web vinculada precisa estar acessível ao público e carregar corretamente, não estar localizada atrás de um login ou de uma autenticação.
- Cada URI precisa ser exclusivo e apontar consistentemente para a página da Web do produto correto. O conteúdo precisa refletir com precisão as informações do produto no catálogo. Mantenha o mesmo nome de domínio de nível superior em todos os URIs de produtos.
Inventário de produtos
O inventário de produtos inclui:
Preço, tanto o atual quanto o original
Disponibilidade, como em estoque, esgotado, aguardando estoque e em pré-venda
Quantidade disponível
Informações de fulfillment, como retirada na loja, frete para a loja e entrega no dia seguinte
Há dois níveis de inventário: no nível do produto e local.
Inventário no nível do produto
Para varejistas que vendem apenas on-line, o inventário é especificado no nível do produto. O preço, a disponibilidade e outros dados de inventário são definidos para cada produto no catálogo.
Para mais informações sobre o inventário no nível do produto, incluindo como manter dados de inventário, consulte Atualizar o inventário da Vertex AI Search for commerce.
Inventário local
Os varejistas que têm lojas físicas e on-line precisam manter as informações de inventário por loja. Eles usam o inventário local para fazer isso.
Há dois campos de produto que podem ser usados para armazenar inventário local. Os dois campos são listas de locais (IDs de lugar) com informações de inventário associadas:
Product.fulfillmentInfo. Métodos de retirada e envio em cada loja
Product.localInventories. Informações de preço, atributos do produto e métodos de retirada e frete em cada local da loja
Você pode usar um ou os dois campos para as informações da loja.
Para mais informações sobre inventários locais, consulte Atualizar o inventário local para a Pesquisa da Vertex AI para e-commerce.
Estrutura de inventário de variante principal
A estrutura de dados de inventário de variante principal é composta por produtos principais, variantes e de inventário local:
Produtos principais: os dados de produtos principais são armazenados sem preços.
Produtos variantes (com o menor preço do país): por exemplo, a variante do produto principal (cor, tamanho) precisa ter o menor preço do país. Os dados de preço da variante são acumulados nos dados do produto principal, e o preço principal é usado para fins de classificação. Os preços específicos de um local são ignorados.
Inventário local (preços específicos da região ou da loja): use as informações de preço do inventário local na reclassificação no momento da veiculação.
Atributos principais do produto: os produtos principais só podem incluir atributos comuns a todas as variantes associadas.
Correção da disponibilidade do produto
O campo de disponibilidade é definido pelo sistema de atualização de inventário à medida que o estado do estoque do produto muda. Acompanhe todos os produtos que estão no estado IN_STOCK e OUT_OF_STOCK.
Se a maioria dos produtos estiver como OUT_OF_STOCK, a resposta da pesquisa terá muitos produtos esgotados. Ao adicionar um filtro, os números de recall serão reduzidos. Se o produto estiver esgotado, mas o estado do catálogo for IN_STOCK, os usuários vão ver o produto como disponível, mas provavelmente terão problemas no momento da compra ou ao adicionar ao carrinho. Isso afeta mais a experiência do cliente do que o treinamento de modelo. Mantenha o campo Product.availability o mais atualizado possível usando as APIs patchProduct ou importe APIs com um readMask.
Esquema de produto
Ao importar um catálogo do BigQuery, use o seguinte esquema de produto da Pesquisa da Vertex AI para e-commerce para criar uma tabela do BigQuery com o formato correto e carregá-la com os dados do catálogo. Em seguida, importe o catálogo.
Usar campos integrados em vez de atributos personalizados
Para todos os outros atributos de produto que não fazem parte do esquema de informações do produto, use Product.attributes (atributos personalizados).
Os campos de produtos integrados, como título, descrição e marcas, têm um impacto maior na capacidade de pesquisa e indexação do que os atributos personalizados.
Em outras palavras, o back-end tem um entendimento mais profundo dos campos integrados do que dos atributos personalizados. O back-end considera as informações dos campos integrados para otimizar a relevância. Por isso, use os campos integrados. Isso significa mapear as informações do produto para campos integrados sempre que possível e usar atributos do cliente apenas quando necessário.
Por exemplo, definir as marcas no campo Product.brands tem um impacto muito maior na pesquisa e no recall do que definir as mesmas informações em um atributo personalizado. Para um atributo como sleeve length, que não tem suporte nativo, é melhor usar atributos personalizados.
Usar o campo "marca"
O campo "Marca" nas informações do produto, que por padrão pode ser pesquisado, indexado e facetado, é um indicador forte para classificação e relevância. Uma boa porcentagem de consultas de pesquisa é da forma brand query ou query brand, e, sem dúvida, a marca é uma das facetas mais usadas.
As taxas de conversão de clique e compra são muito afetadas se o produto tiver o campo de marca correto. Por isso, é importante preencher o campo "Marca" com as informações corretas e, se possível, nunca deixar em branco. O que é mais prejudicial é preencher com palavras aleatórias nos nomes das marcas, como "NA", "Not available" ou "Miscellaneous". Isso associa fortemente o produto ao texto mencionado no campo "Marcas", o que pode levar a uma compreensão errada do produto e a uma recordação ruim.
Se um produto específico não estiver associado a nenhuma marca, é melhor deixar os campos vazios. Mas é preciso ter cuidado para que esses produtos de marca vazios representem uma pequena porcentagem dos produtos do catálogo.
Usar o campo "Público-alvo"
Há dois subcampos no campo "Público-alvo" das informações do produto. Há Audience.gender e Audience.ageGroup. É muito mais eficaz preencher esses campos com os dados adequados, o que ajuda o modelo a entender o público-alvo do produto.
Isso é muito importante quando a personalização está ativada. Ter gender e ageGroup ajuda a segmentar melhor os produtos e permite que o modelo se lembre do produto certo para o usuário adequado.
Os dados de Audience também são úteis quando você faz consultas como camisas femininas ou meias masculinas. Com as informações do público-alvo preenchidas, o entendimento do produto é muito melhor, e o modelo melhorou a capacidade de recall para consultas específicas de gênero.
Procure produtos com títulos duplicados
O Product.title provavelmente é o campo mais importante, já que a maioria das consultas de pesquisa teria uma grande sobreposição com o que está definido como Product.title. É provavelmente a primeira informação que os usuários finais veem e com que interagem na visualização da página de detalhes. Por isso, é uma boa prática manter o product.title exclusivo e ter informações de texto mais relevantes para o produto.
Ter dois produtos (principais) com o mesmo título afeta a capacidade de pesquisa e a relevância dos resultados retornados. Se houver dois produtos principais separados com diferenças significativas, mantenha os títulos diferentes. Se os produtos forem iguais, mas tiverem apenas algumas diferenças, como cor ou tamanho, estruture-os como tipos principal e variante.
Configurações de idioma
A Vertex AI Search for commerce é compatível com vários idiomas. Saiba mais aqui. O mais importante é que o catálogo e a consulta de pesquisa precisam estar no mesmo idioma. Não há tradução entre idiomas de consultas ou informações do catálogo. Por exemplo, se o catálogo estiver em espanhol, a consulta de pesquisa também precisará estar em espanhol.
Por isso, é importante marcar o código de idioma nas informações do produto de acordo com o idioma usado. Caso contrário, o padrão será inglês (en-US). Isso é importante para controles de pesquisa como spellCorrectionSpec, em que, se o idioma não estiver definido, isso vai gerar um comportamento indesejado. Isso também é extremamente importante para entender a intenção da consulta.
Configurações de informações de preço
O campo Product.priceInfo precisa ser o mais preciso e completo possível. Essas informações de preço são usadas para derivar indicadores relacionados a descontos e na otimização da receita. Isso é particularmente importante para consultas de navegação.
Para uma estrutura de produto variante principal, preencha o preço de pelo menos uma das variantes.
Para um produto que não tem preços no nível do produto e todos os preços estão no inventário local, ou seja, a pesquisa está sempre vinculada a um inventário local, preencha as informações de preço mediano de todos os preços no nível do inventário com as informações de preço no nível do produto.
Métricas de qualidade de dados do catálogo
A página Qualidade de dados no console de pesquisa para comércio avalia se você precisa atualizar os dados do catálogo para melhorar a qualidade dos resultados da pesquisa e desbloquear os níveis de performance da pesquisa.
A tabela a seguir descreve as métricas de qualidade que a Vertex AI para Pesquisa no comércio usa para ajudar você a avaliar os dados de produtos. Para detalhes sobre como ver métricas de qualidade de dados e níveis de desempenho da pesquisa no console "Pesquisar no comércio", consulte Desbloquear níveis de desempenho da pesquisa.
| Métrica de qualidade do catálogo | Regra de qualidade | Observações |
|---|---|---|
| O URI está presente e acessível | O produto tem um Product.uri válido. O URI precisa estar acessível e corresponder ao seu domínio. |
A Pesquisa usa sinais da Web rastreados com esse URI para melhorar a qualidade da pesquisa. |
| Atende à conformidade de tempo | Product.availableTime é anterior ao horário atual, e Product.expireTime é anterior ao horário atual. |
Somente produtos em conformidade com o horário estão disponíveis para pesquisa. |
| O atributo pesquisável está presente | O produto tem pelo menos um attribute definido para pesquisa. |
Os atributos personalizados marcados como pesquisáveis podem ser pesquisados por consultas de texto. |
| A descrição está presente | O produto não tem um Product.description vazio. |
Uma descrição abrangente ajuda a melhorar a qualidade da pesquisa. |
| O título consiste em pelo menos duas palavras | Product.title consiste em pelo menos duas palavras. |
Um título abrangente ajuda a melhorar a qualidade da pesquisa. |
| Tem variante com imagem | O produto variant tem pelo menos um Product.image. Você pode ignorar essa métrica se todos os seus produtos estiverem no nível primary. |
Essa métrica é apenas informativa e não afeta a qualidade da pesquisa. |
| Tem variante com informações de preço | O produto variant tem Product.priceInfo definido. Você pode ignorar essa métrica se todos os seus produtos estiverem no nível primary. |
Essa métrica é apenas informativa e não afeta a qualidade da pesquisa. |