在 Looker 中配置对话分析的最佳实践

借助对话式分析,用户可以在 Looker 实例中以自然语言提问,查询以 LookML 建模的数据。用户可以通过以下方式查询数据:

本指南提供了相关策略和最佳实践,可帮助 LookML 开发者成功配置和优化对话式分析。本指南涵盖了以下主题:

通过准备 LookML 模型和对话式分析,您可以提高用户采用率,并确保用户获得准确且实用的问题解答。

了解 Gemini for Google Cloud 如何以及何时使用您的数据

对话式分析的 LookML 最佳实践

对话式分析功能会利用以下两种主要输入内容来解读自然语言问题:

  1. LookML 模型:对话式分析会分析 Looker 探索所基于的 LookML 模型中定义的结构、字段(维度、度量)、标签、说明和同义词。

  2. 不同的字段值:对话式分析会检查字段(尤其是字符串维度和同义词)中的数据值,以确定用户可能会询问的可用类别和实体。基数(唯一值的数量)可能会影响这些值的使用方式。

对话分析的有效性直接取决于这两个输入的质量和清晰度。下表列出了不清晰或模棱两可的 LookML 可能会对对话式分析产生哪些负面影响,以及如何改进输出和用户体验。

常见的 LookML 质量问题 更清晰的对话式分析解决方案
不够清晰:没有清晰标签或说明的字段对于对话分析及其用户来说都是模棱两可的。 应用清晰的标签:使用 label 参数为字段提供直观且适合业务的名称,以便用户在提问时使用。
字段过多:公开过多的字段,尤其是内部 ID(主键)、从联接继承的重复字段或中间计算字段,可能会使对话式分析可用的选项过于杂乱。 隐藏无关字段:确保所有主键、外键、联接中的冗余字段和纯技术字段都保持隐藏状态。

(可选)扩展探索:如果探索包含大量字段,请考虑创建扩展现有探索的新探索。这样一来,您就可以为对话式分析量身打造热门内容的专用版本,而无需修改其他内容可能依赖的探索。
命名冲突:如果探索中的不同视图内有多个字段的名称或标签相似或相同,可能会导致字段选择不正确。 撰写详尽的说明:说明为对话式分析提供了关键的背景信息。使用 description 参数执行以下任务:
  • 使用自然语言清楚地描述该字段。
  • 包含公司或行业专用术语或同义词。
  • 解释计算或背景信息。对话式分析使用说明来更好地识别字段含义并映射用户字词。

例如,标签为 user_count 的字段的说明可以是“访问过网站的唯一身份用户总数”。

标准化命名:检查字段名称和标签是否一致且清晰。
隐藏的复杂性:如果严重依赖信息中心级自定义字段或表格计算,则潜在的关键业务逻辑将无法供对话式分析使用。 纳入自定义逻辑:确定重要且常用的自定义字段表格计算。将这些字段的逻辑转换为 LookML 维度和度量,以便对话式分析可以使用它们。
杂乱的数据:以下类型的不一致或结构不良的数据会让对话式分析难以准确解读查询。
  • 值差异:大小写或命名惯例不一致(例如,值 completeCompleteCOMPLETE 混用)可能会导致对话式分析中的数据重复或数据关系不正确。
  • 数据类型不一致:如果列本应为数值,但偶尔包含字符串值,则会导致字段类型强制为 string,从而阻止数值运算。
  • 时区不明确:时间戳字段中缺少标准化的时区可能会导致过滤或汇总不正确。
解决地址数据质量问题:尽可能标记在数据整理过程中发现的数据质量问题(不一致的值、类型、时区)。与数据工程团队合作,清理源数据或在 ETL/数据建模层中应用转换。

如需了解有关编写简洁高效的 LookML 的更多最佳实践,请参阅以下文档:

何时向 LookML 添加上下文,何时向对话式分析添加上下文

在对话式分析中,您可以向 LookML 和代理指令添加上下文输入内容,例如字段同义词和说明。在决定在何处添加背景信息时,请遵循以下指南:始终为 true 的背景信息应直接添加到 LookML 模型中。Looker 探索可在多个位置使用,包括信息中心和对话式分析,因此在 LookML 中应用的情境必须适用于所有可能会与数据互动的用户。

代理上下文应为定性,并侧重于用户,并且可以有多个代理通过一个探索来为不同的用户提供服务。以下是应包含在智能体指令中但不应包含在 LookML 中的上下文示例:

  • 与代理互动的用户是谁?导师的职责是什么?是公司内部人员还是外部人员?他们之前的数据分析经验如何?
  • 用户的目标是什么?他们希望在对话结束时做出哪种类型的决策?
  • 该用户会提出哪些类型的问题?
  • 哪些字段是此用户的特有字段?相应用户永远不需要使用哪些字段?

设置探索以用于 Conversational Analytics 的最佳实践

为了帮助对话分析提供最有用的答案,请考虑在定义探索以用作对话分析的数据源时,遵循以下最佳实践:

  • 在探索的底层 LookML 中,仅定义对最终用户进行分析有用的字段。
  • 为每个字段指定清晰简洁的名称。
  • 为每个字段提供清晰的说明,并在相关情况下提供示例值。这些字段说明包含在发送给 Conversational Analytics 的提示中,有助于提供背景信息。对于字符串字段,示例值尤其有用。