Présentation des prévisions
La prévision est une technique qui vous permet d'analyser les données historiques afin de réaliser une prédiction avisée sur les tendances futures. Par exemple, vous pouvez analyser l'historique des ventes de plusieurs magasins afin de prédire les ventes futures dans ces emplacements. Dans BigQuery ML, vous effectuez des prévisions sur des données de séries temporelles.
Vous pouvez effectuer des prévisions de différentes manières :
- À l'aide de la
AI.FORECASTfonction avec le modèle TimesFM intégré. Utilisez cette approche lorsque vous devez prévoir les valeurs futures d'une seule variable. Cette approche ne nécessite pas de créer ni de gérer un modèle. - À l'aide de la
ML.FORECASTfonction avec leARIMA_PLUSmodèle. Utilisez cette approche lorsque vous devez exécuter un pipeline de modélisation basé sur ARIMA et décomposer la série temporelle en plusieurs composants afin d'expliquer les résultats. Cette approche nécessite de créer et de gérer un modèle. - À l'aide de la
ML.FORECASTfonction avec leARIMA_PLUS_XREGmodèle. Utilisez cette approche lorsque vous devez prévoir les valeurs futures de plusieurs variables. Cette approche nécessite de créer et de gérer un modèle.
En plus des prévisions, vous pouvez utiliser ARIMA_PLUS et ARIMA_PLUS_XREG
modèles pour la détection d'anomalies. Pour en savoir plus, consultez les documents suivants :
- Présentation de la détection d'anomalies
- Effectuer une détection d'anomalies avec un modèle de prévision de séries temporelles multivariées
Comparer les modèles ARIMA_PLUS et le modèle TimesFM
Utilisez le tableau suivant pour déterminer si vous devez utiliser le modèle TimesFM, ARIMA_PLUS ou ARIMA_PLUS_XREG pour votre cas d'utilisation :
| Type de modèle | ARIMA_PLUS et ARIMA_PLUS_XREG |
TimesFM |
|---|---|---|
| Informations sur le modèle | Modèle statistique qui utilise l'algorithme ARIMA pour le composant de tendance et divers autres algorithmes pour les composants sans tendance. Pour en savoir plus, consultez la section
Pipeline de modélisation de séries temporelles et la publication ci-dessous. |
Modèle de fondation basé sur un transformateur. Pour en savoir plus, consultez les publications de la ligne suivante. |
| Publication | ARIMA_PLUS: Large-scale, Accurate, Automatic and Interpretable In-Database Time Series Forecasting and Anomaly Detection in Google BigQuery | A Decoder-only Foundation Model for Time-series Forecasting |
| Entraînement requis | Oui, un ARIMA_PLUS ou ARIMA_PLUS_XREG
modèle est entraîné pour chaque série temporelle. |
Non, le modèle TimesFM est pré-entraîné. |
| Facilité d'utilisation de SQL | Élevée. Nécessite une instruction CREATE MODEL et un
appel de fonction. |
Très élevée. Nécessite un seul appel de fonction. |
| Historique des données utilisé | Utilise tous les points temporels des données d'entraînement, mais peut être personnalisé pour utiliser moins de points temporels. | Peut être personnalisé à l'aide du paramètre context_window de
la
fonction AI.FORECAST. |
| Précision | Très élevée. Pour en savoir plus, consultez les publications listées dans une ligne précédente. | Très élevée. Pour en savoir plus, consultez les publications listées dans une ligne précédente. |
| Personnalisation | Élevée. L'
CREATE MODEL instruction
propose des arguments qui vous permettent d'ajuster de nombreux paramètres de modèle, tels que les
suivants :
|
Faible. |
| Compatible avec les covariables | Oui, lorsque vous utilisez le
ARIMA_PLUS_XREG modèle. |
Non. |
| Explicabilité | Élevée. Vous pouvez utiliser la
ML.EXPLAIN_FORECAST fonction
pour inspecter les composants du modèle. |
Faible. |
| Évaluation du modèle | Utilisez la
ML.ARIMA_EVALUATE fonction. |
Utilisez la
AI.EVALUATE fonction. |
| Meilleurs cas d'utilisation : |
|
|
Connaissances recommandées
En utilisant les paramètres par défaut des instructions et des fonctions de BigQuery ML, vous pouvez créer et utiliser un modèle de prévision même sans grandes connaissances en ML. Toutefois, des connaissances de base sur le développement de ML, et en particulier sur les modèles de prévision, vous aident à optimiser vos données et votre modèle pour obtenir de meilleurs résultats. Nous vous recommandons d'utiliser les ressources suivantes pour vous familiariser avec les techniques et les processus de ML :
- Cours d'initiation au machine learning
- Présentation du machine learning
- Machine learning intermédiaire
- Série temporelle