預測總覽

預測指的是分析歷來資料,然後據以預測未來趨勢的技術。舉例來說,您可以分析多個門市的銷售資料,以便預測這些門市未來的銷售業績。在 BigQuery ML 中,您會對時間序列資料執行預測。

您可以透過下列方式進行預測:

  • 使用內建的 TimesFM 模型搭配 AI.FORECAST 函式。如要預測單一變數的未來值,請使用這個方法。這種做法不需要建立及管理模型。
  • 使用 ML.FORECAST 函式搭配 ARIMA_PLUS 模型。如要執行以 ARIMA 為基礎的建模管道,並將時間序列分解為多個元件來解釋結果,請使用這個方法。這種做法需要您建立及管理模型。
  • 使用 ML.FORECAST 函式ARIMA_PLUS_XREG 模型。如要預測多個變數的未來值,請使用這種方法。這種做法需要您建立及管理模型。

除了預測之外,您也可以使用 ARIMA_PLUSARIMA_PLUS_XREG 模型偵測異常狀況。詳情請參閱下列文件:

比較 ARIMA_PLUS 模型和 TimesFM 模型

請參閱下表,根據您的用途決定要使用 TimesFM、ARIMA_PLUSARIMA_PLUS_XREG 模型:

模型類型 ARIMA_PLUSARIMA_PLUS_XREG TimesFM
模型詳細資料 統計模型,趨勢成分使用 ARIMA 演算法,非趨勢成分則使用各種其他演算法。詳情請參閱下方的時間序列模型化管道和發布內容。 以 Transformer 為基礎的基礎模型。詳情請參閱下一列的出版品。
Publication ARIMA_PLUS:Google BigQuery 中大規模、準確、自動且可解讀的資料庫內時間序列預測和異常偵測 時間序列預測專用的僅限解碼器基礎模型
需要訓練 是,每個時間序列都會訓練一個 ARIMA_PLUSARIMA_PLUS_XREG 模型。 否,TimesFM 模型是預先訓練的模型。
SQL 易用性 高。需要 CREATE MODEL 陳述式和函式呼叫。 非常高。需要單一函式呼叫。
使用的資料記錄 使用訓練資料中的所有時間點,但可自訂為使用較少時間點。 使用 512 個時間點。
準確率 非常高。詳情請參閱前幾列列出的出版品。 非常高。詳情請參閱前幾列列出的出版品。
自訂 高。CREATE MODEL 陳述式提供引數,可讓您調整許多模型設定,例如:
  • 季節性
  • 節慶特效
  • 步驟變更
  • 趨勢
  • 移除尖峰和低谷
  • 預測上下限
低。
支援共變數 是,使用 ARIMA_PLUS_XREG 模型時可以。 不用
可解釋性 高。您可以使用 ML.EXPLAIN_FORECAST 函式檢查模型元件。 低。
最佳用途
  • 您想要完全掌控模型,包括自訂模型。
  • 您需要模型輸出內容的可解釋性。
  • 您希望盡量簡化設定,不必先建立模型就能進行預測。

使用 BigQuery ML 陳述式和函式的預設設定,即使沒有太多機器學習知識,也能建立及使用預測模型。不過,如果具備機器學習開發作業的基本知識,尤其是預測模型,有助於您同時最佳化資料和模型,進而獲得更出色的結果。建議您使用下列資源,熟悉機器學習技術和程序: