对话式分析是一项由 Gemini for Google Cloud 提供支持的“与您的数据聊天”功能。对话式分析以 Looker 语义模型层为基础,让组织中的用户能够使用日常、自然的(对话式)语言提出与数据相关的问题,从而实现受监管的可信自助式 BI。这种方法可提供企业级治理和安全性,从而加快组织内分析功能的采用速度。
对话式分析功能可在 Looker (Google Cloud Core) 实例和 Looker(原始版本)实例中使用。
了解 Gemini for Google Cloud 如何以及何时使用您的数据。
主要特性
对话式分析包含以下主要功能:
- 使用自然语言查询探索:使用自然语言与单个探索进行对话,或与最多可查询 5 个探索的数据智能体进行对话。
- 创建用于查询探索的数据代理:您可以提供与您的数据相关的背景信息和指令,自定义由 AI 赋能的数据查询代理,这有助于数据代理生成更准确且与上下文相关的回答。您还可以与其他用户分享数据代理,或将其发布到其他应用(例如 Gemini Enterprise),以便他们可以在相同的上下文中提问。您可以将此类数据代理连接到最多五个探索。
- 使用数据智能体查询信息中心预览版:使用对话式分析生成可查询信息中心及其底层模型的信息中心数据智能体。
- 高级分析:对话式分析中的“高级分析”功能会将您的自然语言问题转换为 Python 代码并执行该代码。与基于标准 SQL 的查询相比,高级分析功能使用 Python 可以实现更复杂的分析和可视化效果。
- 嵌入:您可以使用 HTML iframe 标记将对话式分析嵌入网站或应用中,就像嵌入其他 Looker 内容类型一样。对话式分析支持私密嵌入(用户使用 Looker 登录信息进行身份验证)和签名嵌入(用户通过您自己的应用进行身份验证)。
数据智能体与对话
与数据代理聊天相比于与单个探索进行标准对话,具有以下几个主要优势。虽然从探索开始对话可以快速对特定数据源进行自然语言查询,但数据智能体是一个专门的独立分析师,可以在组织内进行自定义和共享。
与探索功能进行的对话相比,数据代理具有以下优势:
- 与多个探索对话:在与探索对话时,您一次只能查询一个探索。不过,数据代理最多可以连接到 5 个不同的探索,从而让用户能够进行跨领域分析并获得更全面的答案。
- 与 Looker 信息中心对话:当您与信息中心对话时,对话式分析会创建一个信息中心数据智能体,您可以使用该智能体不仅查询信息中心,还可以查询信息中心的底层探索。
- 编写的上下文:您可以为数据智能体提供标准探索对话中没有的自定义指令,包括以下资源:
- 黄金查询:您可以向代理提供自然语言问题和经过验证的 Looker 查询对,以锚定常见的业务模式,并显著减少模型的不确定性。
- 业务术语库:您可以直接在智能体的指令中定义组织专用术语或首字母缩写词。
- 角色框架:您可以为智能体分配特定角色或专业知识,从而为对话设置一致的语气和专业判断。
- 代理专业化:您可以为不同的业务部门创建专业代理,例如收入代理或Ops Agent,而不是使用单一的通用对话界面。这样一来,用户就可以获得更具引导性的分析体验,从而找到最符合其需求的特定字段和过滤条件。
- 协作和重用:探索对话通常仅限一位用户使用,而数据智能体可以与组织中的其他成员共享。共享可确保多位用户能够受益于管理员或数据专家开发的相同授权上下文和治理。
- 自定义行为:您可以配置代理在严格的要求下运行,例如使用默认过滤条件,例如“如果未提及时间范围,则始终默认使用过去 6 个月”。这些防护措施可确保智能体在组织特定的治理和安全标准范围内运行。您还可以隐藏探索中的字段,以防止数据代理在查询中使用这些字段。
下表总结了这些类型的对话和数据代理之间的主要区别:
| 对话式分析功能 | 关键使用场景 | 入口点 | 共享功能 | 限制 |
|---|---|---|---|---|
| 探索对话 |
|
|
通常仅限一位用户使用(不可共享)。 |
|
| 探索数据智能体 |
|
在“对话分析”页面中:选择代理标签页。 | 可以通过授予内容访问权限(查看或管理员访问权限;修改)与组织中的其他用户共享。还可以发布到 Gemini Enterprise(预览版)等外部应用。 |
|
| 信息中心代理 |
|
在信息中心内:选择与此信息中心对话。 | 无法与其他用户共享。 |
|
对话式分析的工作原理是什么?
对话式分析功能使用 Gemini Google Cloud 来解读自然语言问题,并根据 Looker 中的数据提供回答。它使用 Looker 语义模型(即数据的 LookML 定义)作为事实来源,以确保回答准确且一致。对话式分析可以解读您在 LookML 中定义的“收入”或“客户流失”等指标的业务定义,并使用这些定义来提供准确且一致的问题。
为了让回答贴合您的具体数据和业务背景,对话式分析采用了多种技术:
- LookML 架构:在请求开始时,对话式分析会从与其关联的探索中提取架构。对话式分析以多种方式使用 LookML 模型中的参数:
- 字段识别:架构中的元数据可帮助对话式分析锁定相关字段。此元数据包括
name、label、description、type和dimension_group等 LookML 参数。这些参数有助于对话式分析将用户问题中的字词映射到正确的字段。例如,description可以为某个字段提供特定于业务的术语或背景信息。对话式分析会忽略使用hidden参数的任何字段。 - 回答格式:对话式分析使用
label参数来实现用户友好的字段命名,并使用value_format参数来设置回答中的数据格式。
- 字段识别:架构中的元数据可帮助对话式分析锁定相关字段。此元数据包括
- 查询生成:对话式分析会确定查询中应使用哪些字段、过滤条件、排序和限制,而不是直接查询数据库。然后,Looker 会使用底层 LookML 模型来撰写和执行查询。此过程类似于用户与探索界面互动的方式;对话式分析无需了解复杂的联接逻辑或字段定义,因为 Looker 会根据 LookML 模型处理查询组成。查询生成可确保所有查询都遵循 LookML 模型中定义的联接逻辑、过滤、汇总和数据权限。为了生成查询,对话式分析必须确定要在过滤条件中使用的正确值。这些值必须与基础数据中的值完全一致,或者采用更高级的过滤表达式(例如通配符)。为了解决用户在自然语言问题中包含的值与过滤条件可能需要的确切值之间的差异,对话式分析会使用在
parameter字段中通过allowed_value定义的值,并可以使用工具来检查字段中的特定值:- 样本数据:返回字段中的最多 100 个值,以帮助对话式分析了解模式或找到与过滤条件值完全匹配的值。
- 模糊搜索:根据用户输入生成一组搜索字词,并检查这些字词是否出现在某个维度中,以找到合适的过滤条件值。
示例数据和模糊搜索都使用 Looker 的建议 API,因此会受到 LookML 参数(例如
suggestions、suggest_explore和suggest_dimension)的影响。
- 分析:Looker 运行查询后,对话式分析会分析查询结果,以回答用户的问题。对话式分析可以通过以下一种或多种方式分析结果:
- 它使用内置的 Gemini 功能来解读和总结结果。
- 它通过高级分析使用 Python 代码执行对结果的进一步分析。
- 它会根据查询结果创建可视化图表。
借助 Looker 语义模型,对话式分析可让您访问来自各种平台(例如 BigQuery、AlloyDB、Redshift、Snowflake 和 Databricks)的数据,而无需了解底层数据的复杂性,并确保所有回答都保持一致且受管控。
对话式分析数据智能体的工作原理
Conversational Analytics 数据代理会根据两个主要输入内容生成回答:Looker 开发者定义的实例 LookML 架构,以及您在创建或修改代理时编写的代理指令。
数据代理必须根据查询确定要选择哪些 LookML 字段,以及要应用哪些过滤条件、排序或限制。为了准确执行此操作,它会以以下方式将查询中的自然语言映射到自己的代理指令和数据的 LookML 架构:
- 语义术语映射:用户经常在问题中使用行业术语。代理会使用您的代理指令和 LookML 字段元数据来解读您的查询。 例如,对于“我们新增了多少业务?”这一查询,数据代理能够将“新业务”映射到用于计算每月经常性收入的指标。对于“谁是我们的顶级客户?”这一查询,数据代理能够将“顶级”映射到使用次数,并将“客户”映射到名为“客户名称”的维度。
- 映射字段值:智能体使用专用工具对数据进行抽样或执行模糊搜索,以查找特定的数据点,例如“加利福尼亚”或“修身牛仔裤”。例如,如果用户询问“牛仔裤”,代理可能会在商品名字段中触发模糊搜索,以在您的数据库中查找完全匹配的字符串。如果用户要求“纽约”,这是指城市字段还是州字段?智能体可能需要对数据进行抽样,以查看哪个字段包含“NY”,或者提出澄清问题。
- 通过查询示例进行优化:您可以在数据代理指令中提供具体的问题和答案示例(称为“黄金查询”),以提高常见查询或关键查询的准确性。
然后,Looker 会使用这些字段的 LookML 定义以及探索中定义的其他逻辑(包括字段定义、访问权限或用户属性、用户定义的信息中心过滤条件或复杂的 Liquid 或联接逻辑)来构建发送到数据库的查询。由于代理不会编写整个 SQL 查询,因此无需“理解”数据,可以更准确、更确定地运行。
如需详细了解代理如何使用 LookML,请参阅在 Looker 中配置对话式分析的最佳实践文档页面。
文档列表
- 在 Looker 中设置对话式分析:为 Looker 实例启用对话式分析,并向用户授予访问权限。
- Looker 中对话式分析的推荐设置和发布策略:规划向 Looker 实例的用户发布对话式分析。
- 使用自然语言查询探索:开始“对话”,使用自然语言查询单个 Looker 探索中的数据。
- 创建和管理探索数据智能体:创建、修改、删除、共享和发布查询 Looker 探索的数据智能体。
- 使用自然语言查询信息中心 [预览版]:与 AI 赋能的数据代理对话,该代理可以查询信息中心及其底层模型。当您与信息中心“聊天”时,系统会生成信息中心代理。
- 在 Looker 中配置对话式分析的最佳实践:探索相关策略和最佳实践,帮助 Looker 管理员和 LookML 开发者成功配置和优化对话式分析。
- 启用和使用高级分析:启用和使用高级分析,该功能可将您的自然语言问题转换为 Python 代码并执行该代码。
- 嵌入对话式分析:在 HTML iframe 中嵌入对话式分析。
了解 Gemini in Looker 功能的合规性功能
对话式分析功能尚未纳入 FedRAMP 高风险级别或 FedRAMP 中风险级别授权范围。在为 Looker 实例启用 Gemini in Looker 设置之前,请与授权机构讨论 Gemini for Google Cloud的合规性保障是否满足贵组织的需求。
对于 Looker (Google Cloud Core) 实例,每当有新的Assured Workloads 控制软件包发布时,只要满足该软件包的变更要求和流程,就会将 Gemini in Looker 功能作为默认产品添加到该软件包中。Looker 中的对话式分析功能遵循关联的 Looker (Google Cloud Core) 实例的合规性功能,但存在以下例外情况:
所有 Looker 客户都可以使用数据驻留 (DRZ) 支持服务,尤其是针对静态数据的支持服务。与对话式分析相关的所有静态数据都严格位于 Looker 实例内,并且仅限于单个区域。传输中的数据可能会使用全球服务进行处理。
提供反馈
您可以在对话式分析中选择以下选项之一,向 Google 提供有关具体回答的反馈:
- thumb_up 回答不错:表示回答很有帮助。
- thumb_down 回答不佳:表明回答没有帮助。
相关资源
- 详细了解对话式分析 API。
- 查看 Gemini in Looker 功能的价格信息。
- 详细了解 Gemini for Google Cloud。
- 详细了解 Gemini in Looker。
- LookML 基础知识:了解“对话式分析”所基于的 Looker 语义层。
- 在 Looker 中探索数据:了解用于查询数据的“探索”界面,对话式分析功能可对此界面进行补充。
- 访问权限控制和权限管理:了解 Looker 如何管理用户权限和数据访问权限,而对话式分析会遵循这些权限。