Looker 中的对话式分析概览

对话式分析是一项由 Gemini for Google Cloud 提供支持的“与您的数据聊天”功能。对话式分析以 Looker 语义建模层为基础,让组织中的用户能够使用常规自然语言(对话式语言)提出与数据相关的问题,从而实现受监管的、值得信赖的自助式 BI。这种方法通过提供企业级治理和安全性,加快了整个组织对分析的采用。

对话式分析可在 Looker (Google Cloud Core) 实例和 Looker(原始版本)实例中使用。

了解 Gemini for 如何以及何时使用您的数据。 Google Cloud

主要特性

对话式分析包含以下主要特性:

  • 与 Looker 探索对话:在 Looker(原始版本)实例或 Looker (Google Cloud Core) 实例中,使用自然语言与 Looker 探索数据或自定义数据代理进行对话。您可以与单个探索进行对话,也可以与连接到最多五个探索的数据代理进行对话。
  • 创建和管理数据代理:借助数据代理,您可以提供针对您数据的具体背景信息和指令,自定义依托 AI 技术的数据查询代理,这有助于数据代理生成更准确且与上下文相关的回答。您还可以与其他用户共享数据代理,以便他们可以在相同的背景信息下提问。您可以将代理连接到最多五个探索。
  • 使用 Code Interpreter 进行高级分析 [预览版]:对话式分析中的 Code Interpreter 会将您的自然语言问题转换为 Python 代码并执行该代码。与基于标准 SQL 的查询相比,Code Interpreter 使用 Python 可以实现更复杂的分析和可视化。
  • 将对话式分析嵌入网站或应用:您可以使用 HTML iframe 标记将对话式分析嵌入网站或应用,就像使用其他 Looker 内容类型一样。对话式分析支持私密嵌入(用户使用 Looker 登录信息进行身份验证)和签名嵌入(用户通过您自己的应用进行身份验证)。

对话式分析的工作原理是什么?

对话式分析使用 Gemini for Google Cloud 来解读自然语言问题,并根据 Looker 中的数据提供答案。它使用 Looker 语义模型(数据的 LookML 定义)作为事实来源,以确保回答准确一致。对话式分析可以解读 LookML 中定义的“收入”或“客户流失率”等指标的业务定义,并使用这些定义来提供准确一致的问题。

为了让回答基于您的具体数据和业务背景信息,对话式分析使用了多种技术:

  • LookML 架构:在请求开始时,对话式分析会从与其连接的探索中提取架构。对话式分析以多种方式使用 LookML 模型中的参数:
    • 字段标识:架构中的元数据有助于对话式分析确定相关字段。此元数据包括 LookML 参数,例如 namelabeldescriptiontypedimension_group。这些参数有助于对话式分析将用户问题中的术语映射到正确的字段。例如,description 可以为字段提供特定于业务的术语或背景信息。
    • 回答格式设置:对话式分析使用 label 参数进行用户友好的字段命名,并使用 value_format 参数来设置回答中数据的格式。
  • 查询生成:对话式分析不会直接查询数据库,而是确定查询中应使用的字段、过滤条件、排序和限制。然后,Looker 使用底层 LookML 模型编写并执行查询。此过程类似于用户与探索界面的互动方式;对话式分析不需要了解复杂的联接逻辑或字段定义,因为 Looker 会根据 LookML 模型处理查询编写。查询生成可确保所有查询都遵循 LookML 模型中定义的联接逻辑、过滤、聚合和 数据权限。如需生成查询,对话式分析必须确定要在过滤条件中使用的正确值。这些值必须与底层数据中的值完全匹配,或者使用更高级的过滤表达式(例如通配符)。为了解决用户在自然语言问题中包含的值与过滤条件可能需要的确切值之间的差异,对话式分析使用在 parameter 字段中通过 allowed_value 定义的值,并且可以使用工具检查字段中的特定值:
    • 示例数据:从字段返回最多 100 个值,以帮助对话式分析了解模式或找到与过滤条件值完全匹配的值。
    • 模糊搜索:根据用户输入生成一组搜索字词,并检查这些字词是否存在于维度中,以找到合适的过滤条件值。 示例数据和模糊搜索都使用 Looker 的建议 API,因此会受到 LookML 参数(例如 suggestionssuggest_exploresuggest_dimension)的影响。
  • 分析:Looker 运行查询后,对话式分析会分析查询结果以回答用户问题。对话式分析可以通过以下一种或多种方式分析结果:
    • 它使用内置的 Gemini 功能来解读和总结结果。
    • 它通过 Code Interpreter 使用 Python 代码执行来对结果进行进一步分析。
    • 它根据查询结果创建可视化图表。

通过利用 Looker 语义模型,对话式分析可以访问来自各种平台(例如 BigQuery、AlloyDB、Redshift、Snowflake 和 Databricks)的数据,而无需了解底层数据的复杂性,并确保所有回答都是一致且受监管的。

对话式分析数据代理的工作原理是什么?

对话式分析数据代理的回答基于两个主要输入:实例的 LookML 架构(由 Looker 开发者定义)和代理指令(您在创建代理时编写)。

数据代理必须从查询中确定要选择的 LookML 字段以及要应用的过滤条件、排序或限制。为了准确地执行此操作,它会以以下方式将查询中的自然语言映射到其自己的代理指令和数据的 LookML 架构:

  1. 映射语义术语:用户经常在问题中使用业务术语。代理使用您的代理指令和 LookML 字段元数据来解读您的查询。 例如,对于查询“我们做了多少新业务?”,数据代理能够将“新业务”映射到计算每月经常性收入的度量。对于查询“谁是我们的顶级客户?”,数据代理能够将“顶级”映射到使用次数,并将“客户”映射到名为客户名称 的维度。
  2. 映射字段值:代理使用专用工具对数据进行抽样或执行模糊搜索,以查找特定数据点(例如“加利福尼亚”或“修身牛仔裤”)。 例如,如果用户询问“牛仔裤”,代理可能会在商品名称 字段中触发模糊搜索,以在数据库中查找完全匹配的字符串。如果用户询问“NY”,是指城市 字段还是州/省/自治区/直辖市 字段?代理可能需要对数据进行抽样,以查看哪个字段包含“NY”,或者提出澄清问题。
  3. 使用查询示例进行优化:您可以在数据代理指令中提供特定的问答示例(称为“黄金查询”),以提高常见或关键查询的准确性。

然后,Looker 使用这些字段的 LookML 定义以及探索中定义的其他逻辑(包括字段定义、访问权限授予用户属性,或复杂的Liquid或联接逻辑)来编写发送到数据库的查询。由于代理不会编写整个 SQL 查询,因此不需要“了解”数据,并且可以更准确、更确定地运行。

如需详细了解代理如何使用 LookML,请参阅 Looker 中配置对话式分析的最佳实践 文档页面。

数据代理与对话

与单个探索 进行标准对话相比,创建数据代理 有几个主要优势。虽然从探索开始对话可以快速使用自然语言查询该特定数据源,但数据代理的功能类似于可自定义并在组织内共享的专用独立分析师。

与探索对话相比,数据代理具有以下优势:

  • 与多个探索聊天:在与探索的对话中,您一次只能查询一个探索。但是,数据代理可以连接到最多 五个不同的探索,让用户能够执行跨领域分析并获得更全面的回答。
  • 编写的背景信息:您可以为数据代理提供标准探索对话中没有的自定义指令,包括以下资源:
    • 黄金查询:您可以为代理提供成对的自然语言问题和经过验证的 Looker 查询,以锚定常见的业务模式并显著减少模型的不确定性。
    • 业务术语库:您可以直接在代理的指令中定义特定于组织的术语或缩写。
    • 角色设定框架:您可以为代理分配特定角色或专业知识,为对话设置一致的语气和专业判断。
  • 代理专业化:您可以为不同的业务部门创建专用代理,例如收入代理Ops Agent,而不是使用对话的单个通用界面。这样可以提供更具指导性的分析体验,引导用户找到与其需求最相关的特定字段和过滤条件。
  • 协作和重复使用:探索对话通常仅限于一位用户,而数据代理可以与其他组织成员共享。共享可确保多位用户能够受益于管理员或数据专家开发的相同编写的背景信息和治理。
  • 自定义行为:您可以将代理配置为在严格的要求下运行,例如使用默认过滤条件(例如,“如果未提及时间范围,则始终默认为最近 6 个月”)。这些防护措施可确保代理在组织特定的治理和安全标准内运行。您还可以在探索中隐藏字段,以防止数据代理在查询中使用这些字段。

文档列表

了解 Gemini in Looker 功能的合规性功能

对话式分析尚未纳入 FedRAMP 高或 FedRAMP 中 授权边界。在为 Looker 实例启用 Gemini in Looker 设置之前,请与授权机构讨论 Gemini for Google Cloud's 的合规性保证是否满足组织的需求。

对于 Looker (Google Cloud Core) 实例,每个Assured Workloads 控制软件包都会在满足该软件包的更改要求和流程后,将 Gemini in Looker 功能添加为默认产品。Looker 中的对话式分析遵循关联的 Looker (Google Cloud Core) 实例的合规性功能,但以下情况除外:

所有 Looker 客户都可以获得数据驻留 (DRZ) 支持,特别是针对静态数据。与对话式分析关联的所有静态数据都严格驻留在 Looker 实例中,并且仅限于单个区域。传输中的数据可能会使用全球服务进行处理。

提供反馈

您可以选择以下选项之一,向 Google 提供有关对话式分析中各个回答的反馈:

  • thumb_up 回答不错:表示回答很有帮助。
  • thumb_down 回答不佳:表示回答没有帮助。