预测概览

预测是指分析历史数据,以便对未来趋势做出明智的预测。例如,您可以分析多个店面位置的历史销售数据,以预测这些位置的未来销售情况。在 BigQuery ML 中,您可以对时序数据执行预测。

您可以通过以下方式进行预测:

  • 通过将 AI.FORECAST 函数与内置的 TimesFM 模型结合使用。如果您需要预测单个变量的未来值,请使用此方法。此方法不要求您创建和管理模型。
  • 通过将 ML.FORECAST 函数ARIMA_PLUS 模型结合使用。如果您需要运行基于 ARIMA 的建模流水线并将时序分解为多个组成部分以解释结果,请使用此方法。此方法要求您创建和管理模型。
  • 通过将 ML.FORECAST 函数ARIMA_PLUS_XREG 模型结合使用。 如果您需要预测多个变量的未来值,请使用此方法。此方法要求您创建和管理模型。

除了预测之外,您还可以使用 ARIMA_PLUSARIMA_PLUS_XREG 模型进行异常值检测。如需了解详情,请参阅以下文档:

比较 ARIMA_PLUS 模型和 TimesFM 模型

请参考以下表格,根据您的使用场景来决定是使用 TimesFM、ARIMA_PLUS 还是 ARIMA_PLUS_XREG 模型:

模型类型 ARIMA_PLUSARIMA_PLUS_XREG TimesFM
模型详情 一种统计模型,使用 ARIMA 算法处理趋势组件,并使用各种其他算法处理非趋势组件。如需了解详情,请参阅时序建模流水线和下方的发布内容。 基于 Transformer 的基础模型。如需了解详情,请参阅下行中的发布内容。
发布内容 ARIMA_PLUS:Google BigQuery 中的大规模、准确、自动且可解释的数据库内时序预测和异常检测 用于时序预测的仅使用解码器的基础模型
需要训练 需要,针对每个时序训练一个 ARIMA_PLUSARIMA_PLUS_XREG 模型。 不需要,TimesFM 模型已经过预训练。
SQL 易用性 高。需要 CREATE MODEL 语句和函数调用。 非常高。需要单次函数调用。
使用的数据历史记录 使用训练数据中的所有时间点,但可以自定义为使用较少的时间点。 使用 512 个时间点。
准确率 非常高。如需了解详情,请参阅上一行中列出的发布内容。 非常高。如需了解详情,请参阅上一行中列出的发布内容。
自定义 高。CREATE MODEL 语句提供了一些参数,可用于对许多模型设置进行调优,例如以下这些:
  • 季节性
  • 节假日效应
  • 步进变化
  • 趋势
  • 移除高峰和低谷
  • 预测上限和下限
低。
支持协变量 支持(使用 ARIMA_PLUS_XREG 模型时)。 不支持。
可解释性 高。您可以使用 ML.EXPLAIN_FORECAST 函数检查模型组件。 低。
最佳应用场景
  • 您希望完全控制模型,包括自定义。
  • 您需要具备模型输出可解释性。
  • 您希望尽可能减少设置,即在不先创建模型的情况下进行预测。

通过使用 BigQuery ML 的语句和函数的默认设置,即使您没有太多机器学习知识,也可以创建和使用预测模型。不过,如果您具备机器学习开发(尤其是预测模型)的基本知识,则有助于您优化数据和模型,从而获得更好的结果。我们建议您使用以下资源来熟悉机器学习技术和流程: