使用 ARIMA_PLUS 单变量模型预测多个时序

本教程介绍了如何使用 ARIMA_PLUS 单变量时序模型根据给定列的历史值来预测该列的未来值。

本教程将介绍如何预测多个时序。系统会针对每个时间点，为一个或多个指定列中的每个值计算预测值。例如，如果您想预测天气并指定了一个包含城市数据的列，则预测数据会包含城市 A 在所有时间点的预测值，然后是城市 B 在所有时间点的预测值，依此类推。

本教程使用来自公开的 bigquery-public-data.new_york.citibike_trips 表中的数据。此表包含有关纽约市花旗单车行程的信息。

在阅读本教程之前，我们强烈建议您阅读使用单变量模型预测单个时序。

目标

本教程将指导您完成以下任务：

使用 CREATE MODEL 语句创建时序模型以预测单车行程数量。
使用 ML.ARIMA_EVALUATE 函数评估模型中的自动回归集成移动平均线 (ARIMA) 信息。
使用 ML.ARIMA_COEFFICIENTS 函数检查模型系数。
使用 ML.FORECAST 函数从模型中检索预测的骑行信息。
使用 ML.EXPLAIN_FORECAST 函数检索时序的组成部分，例如季节性和趋势。您可以检查这些时序组成部分，以解释预测值。

费用

本教程使用 Google Cloud的可计费组件，包括：

BigQuery
BigQuery ML

如需详细了解 BigQuery 费用，请参阅 BigQuery 价格页面。

如需详细了解 BigQuery ML 费用，请参阅 BigQuery ML 价格。

准备工作

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

新项目会自动启用 BigQuery。如需在预先存在的项目中激活 BigQuery，请前往
Enable the BigQuery API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the API

所需权限

如需创建数据集，您需要拥有 bigquery.datasets.create IAM 权限。
如需创建模型，您需要以下权限：
- bigquery.jobs.create
- bigquery.models.create
- bigquery.models.getData
- bigquery.models.updateData
如需运行推理，您需要以下权限：
- bigquery.models.getData
- bigquery.jobs.create

如需详细了解 BigQuery 中的 IAM 角色和权限，请参阅 IAM 简介。

创建数据集

创建 BigQuery 数据集以存储机器学习模型。

控制台

在 Google Cloud 控制台中，前往 BigQuery 页面。

转到 BigQuery 页面
在探索器窗格中，点击您的项目名称。
点击 查看操作 > 创建数据集
在 创建数据集 页面上，执行以下操作：
- 在数据集 ID 部分，输入 bqml_tutorial。
- 在位置类型部分，选择多区域，然后选择 US (multiple regions in United States)（美国[美国的多个区域]）。
- 保持其余默认设置不变，然后点击创建数据集。

bq

如需创建新数据集，请使用带有 --location 标志的 bq mk 命令。如需查看完整的潜在参数列表，请参阅 bq mk --dataset 命令参考文档。

创建一个名为 bqml_tutorial 的数据集，并将数据位置设置为 US，说明为 BigQuery ML tutorial dataset：
```
bq --location=US mk -d \
 --description "BigQuery ML tutorial dataset." \
 bqml_tutorial
```
该命令使用的不是 --dataset 标志，而是 -d 快捷方式。如果省略 -d 和 --dataset，该命令会默认创建一个数据集。
确认已创建数据集：
```
bq ls
```

API

使用已定义的数据集资源调用 datasets.insert 方法。

{
  "datasetReference": {
     "datasetId": "bqml_tutorial"
  }
}

BigQuery DataFrame

在尝试此示例之前，请按照《BigQuery 快速入门：使用 BigQuery DataFrames》中的 BigQuery DataFrames 设置说明进行操作。如需了解详情，请参阅 BigQuery DataFrames 参考文档。

如需向 BigQuery 进行身份验证，请设置应用默认凭证。如需了解详情，请参阅为本地开发环境设置 ADC。

import google.cloud.bigquery

bqclient = google.cloud.bigquery.Client()
bqclient.create_dataset("bqml_tutorial", exists_ok=True)

直观呈现输入数据

在创建模型之前，您可以选择直观呈现输入时序数据，以了解分布情况。您可以使用 Looker Studio 执行此操作。

SQL

以下查询的 SELECT 语句使用 EXTRACT 函数从 starttime 列中提取日期信息。该查询使用 COUNT(*) 子句获取花旗单车的每日总行程数。

请按照以下步骤直观呈现时序数据：

在 Google Cloud 控制台中，前往 BigQuery 页面。

转到 BigQuery

在查询编辑器中，粘贴以下查询，然后点击运行：

SELECT
 EXTRACT(DATE from starttime) AS date,
 COUNT(*) AS num_trips
FROM
`bigquery-public-data.new_york.citibike_trips`
GROUP BY date;

查询完成后，依次点击打开方式 > Looker Studio。Looker Studio 将在新标签页中打开。在该新标签页中完成以下步骤。
在 Looker Studio 中，依次点击插入 > 时序图表。
在图表窗格中，选择设置标签页。
在指标部分，添加 num_trips 字段，并移除默认的记录数指标。生成的图表如下所示：

BigQuery DataFrame

如需向 BigQuery 进行身份验证，请设置应用默认凭证。如需了解详情，请参阅为本地开发环境设置 ADC。


import bigframes.pandas as bpd

df = bpd.read_gbq("bigquery-public-data.new_york.citibike_trips")

features = bpd.DataFrame(
    {
        "num_trips": df.starttime,
        "date": df["starttime"].dt.date,
    }
)
date = df["starttime"].dt.date
df.groupby([date])
num_trips = features.groupby(["date"]).count()

# Results from running "print(num_trips)"

#                num_trips
# date
# 2013-07-01      16650
# 2013-07-02      22745
# 2013-07-03      21864
# 2013-07-04      22326
# 2013-07-05      21842
# 2013-07-06      20467
# 2013-07-07      20477
# 2013-07-08      21615
# 2013-07-09      26641
# 2013-07-10      25732
# 2013-07-11      24417
# 2013-07-12      19006
# 2013-07-13      26119
# 2013-07-14      29287
# 2013-07-15      28069
# 2013-07-16      29842
# 2013-07-17      30550
# 2013-07-18      28869
# 2013-07-19      26591
# 2013-07-20      25278
# 2013-07-21      30297
# 2013-07-22      25979
# 2013-07-23      32376
# 2013-07-24      35271
# 2013-07-25      31084

num_trips.plot.line(
    # Rotate the x labels so they are more visible.
    rot=45,
)

创建时序模型

您希望预测每个花旗单车站点的单车行程数，这需要使用多个时序模型；输入数据中包含的每个花旗单车站点都需要一个模型。您可以创建多个模型来实现此目的，但这可能会是一个单调乏味且耗时的过程，尤其是当您有大量时序时。您可以改为使用单个查询来创建和拟合一组时序模型，以便一次预测多个时序。

SQL

在以下查询中，OPTIONS(model_type='ARIMA_PLUS', time_series_timestamp_col='date', ...) 子句指示您正在创建一个基于 ARIMA 的时序模型。您可以使用 CREATE MODEL 语句的 time_series_id_col 选项来指定输入数据中要获取预测结果的一个或多个列，在本例中为花旗单车站点，由 start_station_name 列表示。您可以使用 WHERE 子句将起始站点限定为名称中包含 Central Park 的站点。CREATE MODEL 语句的 auto_arima_max_order 选项可控制 auto.ARIMA 算法中用于超参数调优的搜索空间。CREATE MODEL 语句的 decompose_time_series 选项默认为 TRUE，以便在您在下一步中评估模型时返回有关时序数据的信息。

请按照以下步骤创建模型：

在 Google Cloud 控制台中，前往 BigQuery 页面。

转到 BigQuery

在查询编辑器中，粘贴以下查询，然后点击运行：

CREATE OR REPLACE MODEL `bqml_tutorial.nyc_citibike_arima_model_group`
OPTIONS
(model_type = 'ARIMA_PLUS',
 time_series_timestamp_col = 'date',
 time_series_data_col = 'num_trips',
 time_series_id_col = 'start_station_name',
 auto_arima_max_order = 5
) AS
SELECT
 start_station_name,
 EXTRACT(DATE from starttime) AS date,
 COUNT(*) AS num_trips
FROM
`bigquery-public-data.new_york.citibike_trips`
WHERE start_station_name LIKE '%Central Park%'
GROUP BY start_station_name, date;

查询大约需要 24 秒才能完成，之后您就可以访问 nyc_citibike_arima_model_group 模型了。由于查询使用 CREATE MODEL 语句，因此您看不到查询结果。

此查询将创建 12 个时序模型，输入数据中的 12 个花旗单车起始站点各自对应一个模型。由于是并行执行，因此时间成本（大约 24 秒）只是创建单个时序模型的时间成本的 1.4 倍。但是，如果您移除 WHERE ... LIKE ... 子句，则系统将预测 600 多个时序；由于槽容量有限，系统将无法完全并行预测这些时序。在这种情况下，查询大约需要 15 分钟才能完成。如需减少查询运行时间，同时接受可能出现的模型质量略微下降，您可以降低 auto_arima_max_order 的值。这会缩小 auto.ARIMA 算法中超参数调优的搜索空间。如需了解详情，请参阅 Large-scale time series forecasting best practices。

BigQuery DataFrame

在以下代码段中，您在创建一个基于 ARIMA 的时序模型。

如需向 BigQuery 进行身份验证，请设置应用默认凭证。如需了解详情，请参阅为本地开发环境设置 ADC。

from bigframes.ml import forecasting
import bigframes.pandas as bpd

model = forecasting.ARIMAPlus(
    # To reduce the query runtime with the compromise of a potential slight
    # drop in model quality, you could decrease the value of the
    # auto_arima_max_order. This shrinks the search space of hyperparameter
    # tuning in the auto.ARIMA algorithm.
    auto_arima_max_order=5,
)

df = bpd.read_gbq("bigquery-public-data.new_york.citibike_trips")

# This query creates twelve time series models, one for each of the twelve
# Citi Bike start stations in the input data. If you remove this row
# filter, there would be 600+ time series to forecast.
df = df[df["start_station_name"].str.contains("Central Park")]

features = bpd.DataFrame(
    {
        "start_station_name": df["start_station_name"],
        "num_trips": df["starttime"],
        "date": df["starttime"].dt.date,
    }
)
num_trips = features.groupby(
    ["start_station_name", "date"],
    as_index=False,
).count()

X = num_trips["date"].to_frame()
y = num_trips["num_trips"].to_frame()

model.fit(
    X,
    y,
    # The input data that you want to get forecasts for,
    # in this case the Citi Bike station, as represented by the
    # start_station_name column.
    id_col=num_trips["start_station_name"].to_frame(),
)

# The model.fit() call above created a temporary model.
# Use the to_gbq() method to write to a permanent location.
model.to_gbq(
    your_model_id,  # For example: "bqml_tutorial.nyc_citibike_arima_model",
    replace=True,
)

这会创建 12 个时序模型，输入数据中的 12 个花旗单车起始站点各自对应一个模型。由于是并行执行，因此时间成本（大约 24 秒）只是创建单个时序模型的时间成本的 1.4 倍。

评估模型

SQL

使用 ML.ARIMA_EVALUATE 函数评估时序模型。ML.ARIMA_EVALUATE 函数会显示在自动超参数调优过程中为模型生成的评估指标。

请按照以下步骤评估模型：

在 Google Cloud 控制台中，前往 BigQuery 页面。

转到 BigQuery
在查询编辑器中，粘贴以下查询，然后点击运行：
```
SELECT
*
FROM
ML.ARIMA_EVALUATE(MODEL `bqml_tutorial.nyc_citibike_arima_model_group`);
```
结果应如下所示：

虽然 auto.ARIMA 会为每个时序评估几十个候选 ARIMA 模型，但 ML.ARIMA_EVALUATE 默认只会输出最佳模型的信息，以便使输出表紧凑。如需查看所有候选模型，您可以将 ML.ARIMA_EVALUATE 函数的 show_all_candidate_model 参数设置为 TRUE。

BigQuery DataFrame

如需向 BigQuery 进行身份验证，请设置应用默认凭证。如需了解详情，请参阅为本地开发环境设置 ADC。

# Evaluate the time series models by using the summary() function. The summary()
# function shows you the evaluation metrics of all the candidate models evaluated
# during the process of automatic hyperparameter tuning.
summary = model.summary()
print(summary.peek())

# Expected output:
#    start_station_name                  non_seasonal_p  non_seasonal_d   non_seasonal_q  has_drift  log_likelihood           AIC     variance ...
# 1         Central Park West & W 72 St               0               1                5      False    -1966.449243   3944.898487  1215.689281 ...
# 8            Central Park W & W 96 St               0               0                5      False     -274.459923    562.919847   655.776577 ...
# 9        Central Park West & W 102 St               0               0                0      False     -226.639918    457.279835    258.83582 ...
# 11        Central Park West & W 76 St               1               1                2      False    -1700.456924   3408.913848   383.254161 ...
# 4   Grand Army Plaza & Central Park S               0               1                5      False    -5507.553498  11027.106996   624.138741 ...

start_station_name 列用于标识针对其创建时序的输入数据列。这是您在创建模型时使用 time_series_id_col 选项指定的列。

non_seasonal_p、non_seasonal_d、non_seasonal_q 和 has_drift 输出列定义了训练流水线中的 ARIMA 模型。log_likelihood、AIC 和 variance 输出列与 ARIMA 模型拟合过程相关。拟合过程使用 auto.ARIMA 算法确定最佳 ARIMA 模型（每个时序对应一个最佳模型）。

auto.ARIMA 算法使用 KPSS 测试来确定 non_seasonal_d 的最佳值，在本例中为 1。当 non_seasonal_d 为 1 时，auto.ARIMA 算法会并行训练 42 个不同的候选 ARIMA 模型。在此示例中，所有 42 个候选模型均有效，因此输出包含 42 行，每行对应一个候选 ARIMA 模型；如果某些模型无效，则会从输出中排除。这些候选模型将按照 AIC 升序返回。第一行中的模型具有最低的 AIC，它被视为最佳模型。此最佳模型将保存为最终模型，并在您预测数据、评估模型和检查模型系数时使用，如以下步骤所示。

seasonal_periods 列包含有关时序数据中识别出的季节性模式的信息。每个时序可以有不同的季节性模式。例如，您可以从图中看到一个时序具有一个每年模式，而其他时序则没有。

仅当 decompose_time_series=TRUE 时，才会填充 has_holiday_effect、has_spikes_and_dips 和 has_step_changes 列。这些列还反映了输入时序数据的信息，与 ARIMA 建模无关。这些列在所有输出行中也具有相同的值。

检查模型的系数

SQL

使用 ML.ARIMA_COEFFICIENTS 函数检查时序模型的系数。

请按照以下步骤检索模型的系数：

在 Google Cloud 控制台中，前往 BigQuery 页面。

转到 BigQuery
在查询编辑器中，粘贴以下查询，然后点击运行：
```
SELECT
*
FROM
ML.ARIMA_COEFFICIENTS(MODEL `bqml_tutorial.nyc_citibike_arima_model_group`);
```
查询只需不到一秒的时间即可完成。结果应如下所示：

如需详细了解输出列，请参阅 ML.ARIMA_COEFFICIENTS 函数。

BigQuery DataFrame

使用 coef_ 函数检查时序模型的系数。

如需向 BigQuery 进行身份验证，请设置应用默认凭证。如需了解详情，请参阅为本地开发环境设置 ADC。

coef = model.coef_
print(coef.peek())

# Expected output:
#    start_station_name                                              ar_coefficients                                   ma_coefficients intercept_or_drift
# 5    Central Park West & W 68 St                                                [] [-0.41014089  0.21979212 -0.59854213 -0.251438...                0.0
# 6         Central Park S & 6 Ave                                                [] [-0.71488957 -0.36835772  0.61008532  0.183290...                0.0
# 0    Central Park West & W 85 St                                                [] [-0.39270166 -0.74494638  0.76432596  0.489146...                0.0
# 3    W 82 St & Central Park West                         [-0.50219511 -0.64820817]             [-0.20665325  0.67683137 -0.68108631]                0.0
# 11  W 106 St & Central Park West [-0.70442887 -0.66885553 -0.25030325 -0.34160669]                                                []                0.0

start_station_name 列用于标识针对其创建时序的输入数据列。这是您在创建模型时在 time_series_id_col 选项中指定的列。

ar_coefficients 输出列显示了 ARIMA 模型的自动回归 (AR) 部分的模型系数。同样，ma_coefficients 输出列显示了 ARIMA 模型的移动平均值 (MA) 部分的模型系数。这两个列都包含数组值，其长度分别等于 non_seasonal_p 和 non_seasonal_q。intercept_or_drift 值是 ARIMA 模型中的常量项。

使用模型预测数据

SQL

使用 ML.FORECAST 函数预测未来的时序值。

在以下 GoogleSQL 查询中，STRUCT(3 AS horizon, 0.9 AS confidence_level) 子句指示查询会预测 3 个未来的时间点，并生成置信度为 90% 的预测区间。

请按照以下步骤使用模型预测数据：

在 Google Cloud 控制台中，前往 BigQuery 页面。

转到 BigQuery

在查询编辑器中，粘贴以下查询，然后点击运行：

SELECT
*
FROM
ML.FORECAST(MODEL `bqml_tutorial.nyc_citibike_arima_model_group`,
 STRUCT(3 AS horizon, 0.9 AS confidence_level))

点击运行。

查询只需不到一秒的时间即可完成。结果应如下所示：

如需详细了解输出列，请参阅 ML.FORECAST 函数。

BigQuery DataFrame

使用 predict 函数预测未来的时序值。

如需向 BigQuery 进行身份验证，请设置应用默认凭证。如需了解详情，请参阅为本地开发环境设置 ADC。

prediction = model.predict(horizon=3, confidence_level=0.9)

print(prediction.peek())
# Expected output:
#            forecast_timestamp                             start_station_name  forecast_value  standard_error  confidence_level ...
# 4   2016-10-01 00:00:00+00:00                         Central Park S & 6 Ave      302.377201       32.572948               0.9 ...
# 14  2016-10-02 00:00:00+00:00  Central Park North & Adam Clayton Powell Blvd      263.917567       45.284082               0.9 ...
# 1   2016-09-25 00:00:00+00:00                    Central Park West & W 85 St      189.574706       39.874856               0.9 ...
# 20  2016-10-02 00:00:00+00:00                    Central Park West & W 72 St      175.474862       40.940794               0.9 ...
# 12  2016-10-01 00:00:00+00:00                   W 106 St & Central Park West        63.88163       18.088868               0.9 ...

第一列 start_station_name 注释系统拟合每个时序模型所依据的时序。每个 start_station_name 都有三行预测结果（由 horizon 值指定）。

对于每个 start_station_name，输出行按 forecast_timestamp 列值的时间顺序排序。在时序预测中，由 prediction_interval_lower_bound 和 prediction_interval_upper_bound 列值表示的预测区间与 forecast_value 列值一样重要。forecast_value 值是预测区间的中点。预测区间取决于 standard_error 和 confidence_level 列值。

解释预测结果

SQL

除了预测数据，您还可以使用 ML.EXPLAIN_FORECAST 函数获取可解释性指标。ML.EXPLAIN_FORECAST 函数会预测未来的时序值，还会返回该时序的所有单独的组件。如果您只想返回预测数据，请改用 ML.FORECAST 函数，如使用模型预测数据中所示。

ML.EXPLAIN_FORECAST 函数中使用的 STRUCT(3 AS horizon, 0.9 AS confidence_level) 子句指示查询会预测 3 个未来的时间点，并生成置信度为 90% 的预测区间。

请按照以下步骤解释模型的结果：

在 Google Cloud 控制台中，前往 BigQuery 页面。

转到 BigQuery
在查询编辑器中，粘贴以下查询，然后点击运行：
```
SELECT
*
FROM
ML.EXPLAIN_FORECAST(MODEL `bqml_tutorial.nyc_citibike_arima_model_group`,
 STRUCT(3 AS horizon, 0.9 AS confidence_level));
```
查询只需不到一秒的时间即可完成。结果应如下所示：

返回的前几千行都是历史数据。您必须滚动浏览结果才能看到预测数据。

输出行先按 start_station_name 排序，然后按 time_series_timestamp 列值的时间顺序排序。在时序预测中，由 prediction_interval_lower_bound 和 prediction_interval_upper_bound 列值表示的预测区间与 forecast_value 列值一样重要。forecast_value 值是预测区间的中点。预测区间取决于 standard_error 和 confidence_level 列值。

如需详细了解输出列，请参阅 ML.EXPLAIN_FORECAST。

BigQuery DataFrame

除了预测数据，您还可以使用 predict_explain 函数获取可解释性指标。predict_explain 函数会预测未来的时序值，还会返回该时序的所有单独的组件。如果您只想返回预测数据，请改用 predict 函数，如使用模型预测数据中所示。

predict_explain 函数中使用的 horizon=3, confidence_level=0.9 子句指示查询会预测 3 个未来的时间点，并生成置信度为 90% 的预测区间。

如需向 BigQuery 进行身份验证，请设置应用默认凭证。如需了解详情，请参阅为本地开发环境设置 ADC。

explain = model.predict_explain(horizon=3, confidence_level=0.9)

print(explain.peek(5))
# Expected output:
#   time_series_timestamp	        start_station_name	            time_series_type	    time_series_data	    time_series_adjusted_data	    standard_error	    confidence_level	    prediction_interval_lower_bound	    prediction_interval_upper_bound	    trend	    seasonal_period_yearly	    seasonal_period_quarterly	    seasonal_period_monthly	    seasonal_period_weekly	    seasonal_period_daily	    holiday_effect	    spikes_and_dips	    step_changes	    residual
# 0	2013-07-01 00:00:00+00:00	Central Park S & 6 Ave	                history	                  69.0	                   154.168527	              32.572948	             <NA>	                        <NA>	                            <NA>	                 0.0	          35.477484	                       <NA>	                        <NA>	                  -28.402102	                 <NA>	                <NA>	               0.0	         -85.168527	        147.093145
# 1	2013-07-01 00:00:00+00:00	Grand Army Plaza & Central Park S	    history	                  79.0	                      79.0	                  24.982769	             <NA>	                        <NA>	                            <NA>	                 0.0	          43.46428	                       <NA>	                        <NA>	                  -30.01599	                     <NA>	                <NA>	               0.0	            0.0	             65.55171
# 2	2013-07-02 00:00:00+00:00	Central Park S & 6 Ave	                history	                  180.0	                   204.045651	              32.572948	             <NA>	                        <NA>	                            <NA>	              147.093045	      72.498327	                       <NA>	                        <NA>	                  -15.545721	                 <NA>	                <NA>	               0.0	         -85.168527	         61.122876
# 3	2013-07-02 00:00:00+00:00	Grand Army Plaza & Central Park S	    history	                  129.0	                    99.556269	              24.982769	             <NA>	                        <NA>	                            <NA>	               65.551665	      45.836432	                       <NA>	                        <NA>	                  -11.831828	                 <NA>	                <NA>	               0.0	            0.0	             29.443731
# 4	2013-07-03 00:00:00+00:00	Central Park S & 6 Ave	                history	                  115.0	                   205.968236	              32.572948	             <NA>	                        <NA>	                            <NA>	               191.32754	      59.220766	                       <NA>	                        <NA>	                  -44.580071	                 <NA>	                <NA>	               0.0	         -85.168527	        -5.799709

输出行先按 time_series_timestamp 排序，然后按 start_station_name 列值的时间顺序排序。在时序预测中，由 prediction_interval_lower_bound 和 prediction_interval_upper_bound 列值表示的预测区间与 forecast_value 列值一样重要。forecast_value 值是预测区间的中点。预测区间取决于 standard_error 和 confidence_level 列值。

清理

为避免因本教程中使用的资源导致您的 Google Cloud 账号产生费用，请删除包含这些资源的项目，或者保留项目但删除各个资源。

删除您在教程中创建的项目。
或者，保留项目但删除数据集。

删除数据集

删除项目也将删除项目中的所有数据集和所有表。如果您希望重复使用该项目，则可以删除在本教程中创建的数据集：

如有必要，请在Google Cloud 控制台中打开 BigQuery 页面。

打开 BigQuery 页面
在导航窗格中，点击您创建的 bqml_tutorial 数据集。
点击删除数据集以删除数据集、表和所有数据。
在删除数据集对话框中，通过输入数据集的名称 (bqml_tutorial) 来确认该删除命令，然后点击删除。

删除项目

如需删除项目，请执行以下操作：

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.

后续步骤

了解如何使用单变量模型预测单个时序
了解如何使用多变量模型预测单个时序
了解如何在预测多行中的多个时序时扩展单变量模型。
了解如何使用单变量模型分层预测多个时序
如需大致了解 BigQuery ML，请参阅 BigQuery 中的 AI 和机器学习简介。

使用 ARIMA_PLUS 单变量模型预测多个时序 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

目标

费用

准备工作

所需权限

创建数据集

控制台

bq

API

BigQuery DataFrame

直观呈现输入数据

SQL

BigQuery DataFrame

创建时序模型

SQL

BigQuery DataFrame

评估模型

SQL

BigQuery DataFrame

检查模型的系数

SQL

BigQuery DataFrame

使用模型预测数据

SQL

BigQuery DataFrame

解释预测结果

SQL

BigQuery DataFrame

清理

删除数据集

删除项目

后续步骤

使用 ARIMA_PLUS 单变量模型预测多个时序