为了获得最佳实践并测试对话式商务代理界面,您必须考虑其他事项。
实施最佳实践
在实现对话式商务代理界面时,请考虑以下最佳实践:
- 访问者 ID 一致性:有助于确保为给定最终用户的每个请求始终发送唯一的
visitor_id。这对于准确的个性化和模型训练至关重要。理想情况下,此标识符应在最终用户的不同会话以及登录或退出状态下保持一致。 - 分支管理:虽然
default_branch很常见,但如果您的产品目录包含多个分支,请确保您使用的是正确的分支 ID。 - 搜索 API 互动:对于
SIMPLE_PRODUCT_SEARCH和提供refined_search的任何情况,请务必使用refined_search字段中的query或原始查询单独调用核心搜索 API (SearchService.Search),以获取实际的产品详情。对话型 API 主要侧重于对话体验和用户意图理解,而不是直接返回商品结果。 - 界面设计:设计您的网页界面,以直观的方式清晰呈现
conversational_text_response、followup_question和refined_search选项,引导用户操作。
规划 A/B 测试
虽然相关性是一项重要的输入指标,但 Vertex AI Search for Commerce 还会考虑其他变量,以实现业务成效优化:
| 指标 | |
|---|---|
| 每次访问带来的收入 (RPV) | 每次访问带来的收入是衡量搜索效果最有效的指标,因为它会同时考虑转化率、平均订单价值和相关性。 |
| 转化 - 平均订单价值 (AOV) | 转化率和 AOV 都会影响 RPV。 |
| 相关性 - 可购买性 - 价格 | 相关性是用于生成效果出色的搜索结果的输入之一。 |
A/B 测试准备情况核对清单
以下是所用的成效指标:
| 项 | 定义 | 阶段 |
|---|---|---|
| 活动归因方案 | 与 Google 合作,正确细分用户事件以进行衡量。 | 实验前 |
| 监控数据输入 | 能够快速了解训练数据何时包含可能会影响性能的异常情况。 | 实验前 |
| 活动覆盖面 | 我们是否在检测与搜索或 Recommendations AI 会话相关的所有可能结果? | 实验前 |
| 可衡量的成功标准 | 以可衡量的术语记录完成标准的定义。 | 实验前 |
| 能够衡量用户体验偏差 | 确保各实验组的用户体验保持一致。 | 实验期间 |
| VAIS 数据与消费之间的一致性 | 验证是否正在从 API 向 UserEvents 传递提供方信息令牌、过滤器、排序依据、偏移量等。事件和 API 请求之间的访问者/用户 ID 匹配。 | 实验期间 |
| 在实验期间进行调整的审批 | 规划调整活动、记录更改,并相应地调整衡量指标和解读。 | 实验期间 |
实现概念验证或最简可行产品
| 数据注入 | A/B 测试设计 | 性能指标 | 治理和流程 |
|---|---|---|---|
|
最新且完整的商品清单提取 遵循建议的事件提取方法,以确保 Google 与您之间的数据同步。 传递必要的属性,例如实验 ID、访问者 ID,并在适用情况下正确实现搜索令牌。 |
采用实验最佳实践,确保获得可靠的结果:
|
所有评估标准都应是实证性的、可客观衡量的,并且由指标驱动。 就所跟踪指标的确切定义达成一致意见,对于准确衡量效果至关重要。 跟踪的标准指标包括:
| 数据集成、测试、功能发布和优化将是一个迭代过程,需要资源。 |
实验节奏示例
| 满足最低可行性产品依赖项 | 校准衡量 | 部署生产深色模式 | 通过/不通过决定 |
|---|---|---|---|
|
|
|
|

| 持续性测试 | 逐步增加到 X% 的流量 | 衡量、调整和重复 | 逐步增加到 X% 的实时流量 |
|---|---|---|---|
|
|
|
|
成功实验的组成部分
| 校准衡量结果并确定成功标准 | 保持实验的公平性 | 监控数据质量 |
|---|---|---|
|
|
|
角色和实验所有权
| 您 | ||
|---|---|---|
| 质量评估 | Commerce Search 效果 | 用户体验影响 |
| 衡量结果 | 备份/验证 | 权威 |
| 遥测/数据 | 平台容量指标(验证效果) 事件和指数异常 |
归因令牌和重现步骤(验证问题) |
| 搜索平台 |
商品级项目
|
查询/投放商品
|
| 继续/不继续 | 推荐 | 批准 |
在控制台中开展实验
前往 Search for commerce 控制台中的实验页面。
前往“实验”页面使用控制台,通过应用 Google 的归因方法,针对 Vertex AI Search for Commerce 的初始配置和 A/B 测试进行高级自助分析:
监控流量细分、业务指标以及搜索和浏览效果。
在关键字搜索和浏览中应用每次搜索访问的指标。
以时间序列形式查看实验效果,其中包含统计显著性指标。
使用嵌入式 Looker 平台。