在 Gemini 的协助下创建操作

您可以使用 Google Cloud中依托 AI 技术的协作工具 Gemini,在 Dataform 的 .sqlx 文件中生成 SQL 和 Dataform 核心代码。

了解 Gemini for Google Cloud 如何以及何时使用您的数据

Dataform 中的 Gemini 仅支持英语提示。

本文档适用于处理 Dataform 中的工作流的数据分析师、数据科学家和数据开发者。本文假定您了解 Google SQL 语法以及如何创建 Dataform 工作流操作。

准备工作

  1. 在 Google Cloud 控制台中,前往项目选择器页面。

    转到“项目选择器”

  2. 选择或创建 Google Cloud 项目。

    选择或创建项目所需的角色

    • 选择项目:选择项目不需要特定的 IAM 角色,您可以选择已获授角色的任何项目。
    • 创建项目:如需创建项目,您需要拥有 Project Creator 角色 (roles/resourcemanager.projectCreator),该角色包含 resourcemanager.projects.create 权限。了解如何授予角色
  3. 激活 Gemini in BigQuery

生成查询

您可以为 Gemini 提供自然语言语句(或提示),以根据代码库中定义的工作流操作生成 SQL 或 Dataform 核心查询。例如,您可以使用 Gemini 在 .sqlx 表定义文件中生成 SQL SELECT 语句。

如需生成 SQL 或 Dataform 核心查询,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Dataform 页面。

    前往 Dataform 页面

  2. 选择或创建代码库,然后选择或创建工作区

  3. 文件窗格中,选择或创建 .sqlx 文件。

  4. 在文件标签页中,点击 pen_spark Gemini

  5. 在 Gemini 对话框中,输入自然语言提示。

    如果您知道要使用的 SQL 操作,则可以在提示中用英文反引号 (`) 指定操作名称。

  6. 点击生成

    Gemini 会查看您的代码库中定义的 SQL 操作,以找到可能与您的提示相关的操作,并建议查询。

  7. 可选:如需提供反馈,请点击 thumb_up 建议不错 thumb_down 建议没用 chat_info 提供更多反馈

  8. 如需接受建议,请点击插入

查询生成技巧

您可以利用以下技巧改进 Gemini in Dataform 提供的建议:

  • 提供用反引号 (`) 括起来的 SQL 操作名称,例如 `action_name`
  • 如果列名称或其语义关系不明确或比较复杂,您可以在提示中提供上下文,以引导 Gemini 获得您所需的答案。这种方法称为“提示工程”。例如,要促使生成的查询引用列名称,请描述列名称及其与所需答案的相关性。为促使回答引用复杂术语(如生命周期价值毛利),请描述该概念及其与用于改进 SQL 生成结果的数据的相关性。

Gemini 和 Dataform 数据

Dataform 中的 Gemini 可以访问您有权访问的表的元数据。这可能包括表名称、列名、数据类型和列说明。Dataform 中的 Gemini 无法访问表、视图或模型中的数据。如需详细了解 Gemini 如何使用您的数据,请参阅 Gemini for Google Cloud 如何使用您的数据

后续步骤