Cette page vous explique comment utiliser les tests A/B pour comprendre l'impact de Vertex AI Search for Commerce sur votre activité.
Présentation
Un test A/B est un test randomisé avec deux groupes : un groupe de test et un groupe de contrôle. Le groupe de test reçoit un traitement différent (dans ce cas, des prédictions ou des résultats de recherche de Vertex AI Search pour le commerce) de celui appliqué au groupe de contrôle.
Lorsque vous exécutez un test A/B, vous incluez des informations sur le groupe dans lequel se trouvait l'utilisateur au moment de l'enregistrement des événements utilisateur. Ces informations sont utilisées pour affiner le modèle et fournir des métriques.
Les deux versions de votre application doivent être identiques, sauf que les utilisateurs du groupe de test voient les résultats générés par Vertex AI Search for Commerce, contrairement aux utilisateurs du groupe de contrôle. Vous consignez les événements utilisateur pour les deux groupes.
Pour en savoir plus sur la répartition du trafic, consultez la section Répartir le trafic dans la documentation d'App Engine.
Plates-formes de test
Configurez le test avec une plate-forme tierce, telle que VWO ou AB Tasty. Les groupes de contrôle et de test obtiennent chacun un ID de test unique à partir de la plate-forme. Lorsque vous enregistrez un événement utilisateur, spécifiez le groupe dans lequel se trouve l'utilisateur en incluant l'ID de test dans le champ experimentIds. L'ID du test vous permet de comparer les métriques des versions de votre application du point de vue des groupes de contrôle et de test.
Bonnes pratiques pour les tests A/B
L'objectif d'un test A/B est de déterminer avec précision l'impact de la mise à jour de votre site (dans le cas présent, l'utilisation de Vertex AI Search for Commerce). Pour obtenir une mesure précise de l'impact, vous devez concevoir et mettre en œuvre correctement le test afin que les autres différences n'affectent pas les résultats du test.
Mappage recommandé des ID de test
Les ID de test sont utilisés pour les tests A/B, qui vous permettent de comparer Vertex AI Search pour le commerce à une solution de recherche existante. Elles peuvent également être utilisées pour exécuter des tests avec un site e-commerce Vertex AI Search entièrement adopté, où une nouvelle configuration, un nouveau contrôle ou une nouvelle spécification de boost, pour ne citer que quelques exemples, doivent être testés par rapport à un groupe de contrôle.
Le champ "ID de test" des événements utilisateur est un tableau, ce qui permet une mesure plus précise.
Voici quelques exemples de cas d'utilisation :
- Les performances de Vertex AI Search pour le commerce doivent être comparées à celles d'un groupe de contrôle.
- Les performances globales doivent être mesurées.
- Les performances sur mobile uniquement doivent être mesurées.
- Les performances sur ordinateur uniquement doivent être mesurées.
- Les performances de la recherche et des recommandations doivent également être mesurées séparément.
Pour obtenir des mesures aussi précises et segmentées, vous aurez peut-être besoin d'un total de 10 ID de test, dont quatre devront être envoyés dans le tableau d'ID de test d'événements pour chaque événement.
| ID des tests pour le groupe de contrôle des événements | ID de test pour le groupe d'événements de test (recherche pour le commerce) | Portée des événements utilisateur |
|---|---|---|
| Contrôle | Vertex AI Search pour le commerce | Tous les événements |
Control_mobile |
Google_mobile |
Tous les événements mobiles |
Control_desktop |
Google_desktop |
Tous les événements sur ordinateur |
Control_search |
Google_search |
Tous les événements de recherche et associés |
Control_recommendations |
Google_recommendations |
Toutes les recommandations et les événements associés |
Pour mesurer les performances globales, comparez les métriques dérivées des événements avec les ID de test Control et Vertex AI Search for commerce. Pour mesurer les performances de la recherche mobile, comparez les métriques issues des événements avec les ID de test Control_mobile + Control_search par rapport à Google_mobile + Google_search.
Hiérarchie des catégories
Assurez-vous que les mêmes produits ont la même hiérarchie de catégories entre le groupe de contrôle et le groupe de test. Prenons l'exemple d'un site de contrôle où un t-shirt est classé dans la hiérarchie de catégories clothing > mens > tops > tee-shirts, et où le même produit est classé dans une autre hiérarchie de catégories sur le site de test, à savoir mens > popular > tops. Cette configuration entraîne des résultats de recherche et des facettes de catégories différents entre les sites de contrôle et de test. Ce problème a un impact sur l'expérience de navigation, car page_category est l'entrée de l'appel de navigation, avec les filtres.
Parité de l'expérience utilisateur avant les tests A/B
Lorsque vous préparez le site pour les tests A/B, avant de diffuser du trafic de recherche ou de recommandations d'utilisateurs réels vers Vertex AI Search pour le commerce avec le mappage d'ID de test approprié, il est important de noter la parité de l'interface utilisateur et de l'expérience entre le site e-commerce, avec l'ancien backend de recherche utilisé comme contrôle, et le site avec le backend Vertex AI Search pour le commerce.
Voici quelques éléments à tester pour une requête de recherche donnée, entre les pages de résultats de recherche du backend de recherche de contrôle et du backend Vertex AI Search for Commerce :
Le même nombre de facettes s'affiche-t-il ? Si ce n'est pas le cas, consultez les spécifications des facettes et les paramètres des attributs dans Vertex AI Search pour le commerce . C'est important, car les facettes aident les utilisateurs à filtrer les résultats de recherche initiaux et à accéder au produit de leur choix. Des facettes plus pertinentes et plus utiles permettent aux utilisateurs de trouver plus rapidement le produit qu'ils recherchent. Sinon, cela entraîne plus de clics et de défilement, ce qui peut nuire à l'expérience de recherche et, à terme, affecter les taux de conversion et de clics. Cela peut également entraîner l'abandon de la recherche. Par conséquent, si les sites de contrôle et de test présentent des facettes similaires, les utilisateurs ne bénéficient d'aucun avantage injuste lorsqu'ils recherchent des produits sur l'un ou l'autre.
Le placement de produits de sponsors dans les résultats de recherche est une fonctionnalité courante sur de nombreux sites d'e-commerce. La plupart du temps, les produits des sponsors ne font pas partie des résultats de recherche naturels. Veillez à ce que l'emplacement et les produits affichés sur la page de résultats de recherche soient presque identiques, voire identiques, entre le site de contrôle et le site de test. Sinon, du bruit est ajouté à la mesure des métriques de performances des revenus. En fonction de l'unicité des produits sponsorisés entre les sites de contrôle et de test, le bruit peut être plus élevé.
Autres aspects divers de l'interface utilisateur à prendre en compte :
- Les informations sur les prix et les remises sont-elles identiques entre les sites de contrôle et de test ?
- La saisie semi-automatique suggère-t-elle les mêmes suggestions pour la requête de recherche ?
- Les valeurs de facette sont-elles dans le même ordre ?
- Les produits sont-ils listés de la même manière (par exemple, sous forme de liste ou de grille) ?
Derniers conseils et points à prendre en compte
Pour concevoir un test A/B pertinent, gardez ces conseils à l'esprit :
Avant de configurer votre test A/B, utilisez l'aperçu de prédiction ou de recherche pour vous assurer que votre modèle se comporte comme prévu.
Assurez-vous que le comportement de votre site est identique pour le groupe de test et le groupe de contrôle.
Le comportement du site comprend la latence, le format d'affichage, le format de texte, la mise en page, la qualité et la taille des images. Il ne devrait y avoir aucune différence notable pour ces attributs entre les expérience des groupes de contrôle et de test.
Acceptez et affichez les résultats tels qu'ils sont renvoyés par Vertex AI Search pour le commerce, en les affichant dans l'ordre dans lequel ils sont renvoyés.
Il est acceptable de filtrer les articles non disponibles. Toutefois, vous devez éviter de filtrer ou de trier les résultats en fonction des règles de votre entreprise.
Si vous utilisez des événements utilisateur de recherche et que vous incluez le jeton d'attribution requis, assurez-vous qu'ils sont correctement configurés. Consultez la documentation sur les jetons d'attribution.
Assurez-vous que la configuration de diffusion que vous fournissez lorsque vous demandez des résultats de recommandation ou de recherche correspond à votre intention pour ce résultat de recommandation ou de recherche, ainsi qu'à l'emplacement où vous affichez les résultats.
Lorsque vous utilisez des recommandations, la configuration de diffusion affecte la manière dont les modèles sont entraînés et, par conséquent, les produits recommandés. En savoir plus
Si vous comparez une solution existante à Vertex AI Search pour le commerce, assurez-vous que l'expérience du groupe de contrôle est strictement séparée de celle du groupe de test.
Si la solution de contrôle ne fournit pas de recommandation ni de résultat de recherche, n'en fournissez pas à partir de Vertex AI Search pour le commerce sur les pages de contrôle. Cela fausserait les résultats de votre test.
Assurez-vous que vos utilisateurs ne passent pas du groupe de contrôle au groupe de test. Cela est particulièrement important au cours d'une même session, mais nous vous le recommandons également pour les sessions suivantes. Cela améliore les performances des tests et vous aide à obtenir plus rapidement des résultats de tests A/B statistiquement pertinents.