예측 개요
예측은 과거 데이터를 분석하여 미래 추세에 대해 정보에 입각한 예측을 수행하는 기법입니다. 예를 들어 여러 매장 위치의 과거 판매 데이터를 분석하여 해당 위치의 향후 판매를 예측할 수 있습니다. BigQuery ML에서는 시계열 데이터에 대한 예측을 수행합니다.
다음과 같은 방법으로 예측을 실행할 수 있습니다.
- 기본 제공 TimesFM 모델과 함께
AI.FORECAST
함수를 사용합니다. 단일 변수의 향후 값을 예측해야 하고 모델을 미세 조정할 필요가 없는 경우 이 방법을 사용하세요. 이 방법에서는 모델을 만들고 관리할 필요가 없습니다. ARIMA_PLUS
모델과 함께ML.FORECAST
함수를 사용합니다. ARIMA 기반 모델링 파이프라인을 실행하고 결과를 설명하기 위해 시계열을 여러 구성요소로 분해해야 하는 경우 이 방법을 사용하세요. 이 방법을 사용하려면 모델을 만들고 관리해야 합니다.ARIMA_PLUS_XREG
모델과 함께ML.FORECAST
함수를 사용합니다. 여러 변수의 향후 값을 예측해야 하는 경우 이 방법을 사용하세요. 이 방법을 사용하려면 모델을 만들고 관리해야 합니다.
ARIMA_PLUS
및 ARIMA_PLUS_XREG
시계열 모델은 실제로는 단일 모델이 아니라 여러 모델과 알고리즘이 포함된 시계열 모델링 파이프라인입니다. 자세한 내용은 시계열 모델링 파이프라인을 참조하세요.
예측 외에도 ARIMA_PLUS
및 ARIMA_PLUS_XREG
모델을 사용하여 이상치를 감지할 수 있습니다. 자세한 내용은 다음 문서를 참조하세요.
TimesFM 모델과 ARIMA
모델 비교
다음 표를 사용하여 사용 사례에 기본 제공 TimesFM 모델과 함께 AI.FORECAST
를 사용할지 아니면 ARIMA_PLUS
또는 ARIMA_PLUS_XREG
모델과 함께 ML.FORECAST
를 사용할지 결정하세요.
기능 | TimesFM 모델을 사용한 AI.FORECAST |
ARIMA_PLUS 또는 ARIMA_PLUS_XREG 모델을 사용하여 ML.FORECAST |
---|---|---|
모델 유형 | 트랜스포머 기반 파운데이션 모델 | 트렌드 구성요소에는 ARIMA 알고리즘을 사용하고 트렌드가 아닌 구성요소에는 다양한 기타 알고리즘을 사용하는 통계 모델입니다. 자세한 내용은 시계열 모델링 파이프라인을 참조하세요. |
학습이 필요함 | 아니요, TimesFM 모델은 사전 학습됩니다. | 예, 각 시계열에 대해 하나의 ARIMA_PLUS 또는 ARIMA_PLUS_XREG 모델이 학습됩니다. |
SQL 사용 편의성 | 매우 높음. 단일 함수 호출이 필요합니다. | 높음. CREATE MODEL 문과 함수 호출이 필요합니다. |
사용된 데이터 기록 | 512개의 시간 포인트를 사용합니다. | 학습 데이터의 모든 시점을 사용하지만 더 적은 시점을 사용하도록 맞춤설정할 수 있습니다. |
정확성 | 매우 높음. 다른 여러 모델보다 성능이 우수합니다. 자세한 내용은 시계열 예측을 위한 디코더 전용 파운데이션 모델을 참조하세요. | 매우 높음(TimesFM 모델과 동등한 수준) |
맞춤설정 | 낮음 | 높음. CREATE MODEL 문은 다음과 같은 여러 모델 설정을 조정할 수 있는 인수를 제공합니다.
|
공변량 지원 | 아니요. | 예(ARIMA_PLUS_XREG 모델을 사용하는 경우) |
설명 기능 | 낮음 | 높음. ML.EXPLAIN_FORECAST 함수를 사용하여 모델 구성요소를 검사할 수 있습니다. |
최적의 사용 사례 |
|
|
추천 지식
BigQuery ML 문의 기본 설정과 함수를 사용하면 ML 지식이 많지 않더라도 예측 모델을 만들고 사용할 수 있습니다. 하지만 ML 개발, 특히 예측 모델에 관한 기본 지식을 갖추면 데이터와 모델을 모두 최적화하여 더 나은 결과를 얻을 수 있습니다. 다음 리소스를 사용하여 ML 기법과 프로세스에 익숙해지는 것이 좋습니다.