持续查询简介

本文档介绍了 BigQuery 持续查询。

BigQuery 持续查询是持续运行的 SQL 语句。借助持续查询,您可以实时分析 BigQuery 中的传入数据。您可以将持续查询生成的输出行插入 BigQuery 表中,也可以将其导出到 Pub/Sub 或 Bigtable。持续查询可以使用以下方法之一处理已写入标准 BigQuery 表的数据:

您可以使用持续查询执行对时间敏感的任务,例如创建数据洞见并立即采取行动、应用实时机器学习 (ML) 推理,以及将数据复制到其他平台。这样,您就可以将 BigQuery 用作应用决策逻辑的事件驱动型数据处理引擎。

下图显示了常见的持续查询工作流:

此图展示了常见的 BigQuery 持续查询工作流,包括数据注入、处理和导出到 Bigtable 和 Pub/Sub 等目标位置。

使用场景

您可能需要使用持续查询的常见使用场景如下:

  • 个性化的客户互动服务:使用生成式 AI 为每一次客户互动创建量身定制的个性化消息。
  • 异常值检测:构建可让您实时对复杂数据执行异常值和威胁检测的解决方案,以便您更快地对问题做出响应。
  • 可自定义的事件驱动型流水线:使用与 Pub/Sub 的持续查询集成,根据传入的数据触发下游应用。
  • 数据丰富化和实体提取:使用持续查询,通过 SQL 函数和机器学习模型执行实时数据丰富化和转换。
  • 反向提取、转换和加载(反向 ETL):对更适合低延迟应用服务的其他存储系统执行实时反向 ETL。例如,分析或增强写入 BigQuery 的事件数据,然后将其流式传输到 Bigtable 以供应用使用。

支持的操作

持续查询支持以下操作:

授权

运行持续查询作业时使用的 Google Cloud 访问令牌由用户账号生成后,存留时间 (TTL) 为两天。因此,此类作业会在两天后停止运行。服务账号生成的访问令牌可以运行更长时间,但仍必须遵守查询运行时上限。如需了解详情,请参阅使用服务账号运行持续查询

位置

以下位置支持持续查询:

区域说明 区域名称 详情
美洲
艾奥瓦 us-central1 叶形图标 二氧化碳排放量低
蒙特利尔 northamerica-northeast1 叶形图标 二氧化碳排放量低
北弗吉尼亚 us-east4
俄勒冈 us-west1 叶形图标 二氧化碳排放量低
南卡罗来纳 us-east1
美国多区域 us
亚太地区
德里 asia-south2
香港 asia-east2
雅加达 asia-southeast2
孟买 asia-south1
首尔 asia-northeast3
新加坡 asia-southeast1
悉尼 australia-southeast1
台湾 asia-east1
东京 asia-northeast1
欧洲
比利时 europe-west1 叶形图标 二氧化碳排放量低
欧盟多区域 eu
法兰克福 europe-west3 叶形图标 二氧化碳排放量低
伦敦 europe-west2 叶形图标 二氧化碳排放量低
荷兰 europe-west4 叶形图标 二氧化碳排放量低

限制

持续查询存在以下限制:

预留限制

  • 您必须创建企业版或企业 Plus 版预留,才能运行持续查询。持续查询不支持按需计算结算模式。
  • 创建 CONTINUOUS 预留分配时,关联的预留最多只能有 500 个槽。您可以通过联系 bq-continuous-queries-feedback@google.com 申请提高此上限。
  • 持续查询预留分配不会共享空闲槽,即使预留已配置为共享空闲槽也是如此。
  • 您无法创建在同一预留中使用与持续查询预留分配不同的作业类型的预留分配。
  • 您无法配置持续查询并发。BigQuery 会根据使用 CONTINUOUS 作业类型的可用预留分配,自动确定可以并发运行的持续查询的数量。
  • 使用同一预留运行多个持续查询时,单个作业可能无法公平地拆分可用资源(由 BigQuery 公平性定义)。

槽自动扩缩

连续查询可以使用槽自动扩缩来动态扩缩分配的容量,以满足您的工作负载需求。随着持续查询工作负载的增加或减少,BigQuery 会动态地调整槽。

连续查询开始运行后,它会主动监听传入的数据,这会消耗槽资源。虽然包含正在运行的持续查询的预留不会缩减到零个槽,但主要监听传入数据的空闲持续查询预计会占用最少数量的槽,通常约为 1 个槽。

价格

持续查询使用 BigQuery 容量计算价格,以为单位。如需运行持续查询,您必须拥有使用企业版或企业 Plus 版预留以及使用 CONTINUOUS 作业类型的预留分配

其他 BigQuery 资源(例如数据注入和存储)的使用费用按 BigQuery 价格中显示的费率收取。

接收持续查询结果或在持续查询处理期间被调用的其他服务的使用,将按照针对这些服务发布的费率收费。如需了解持续查询使用的其他 Google Cloud 服务的价格,请参阅以下主题:

后续步骤

尝试创建持续查询