Agent Platform vous permet d'effectuer des opérations de machine learning avec des données tabulaires à l'aide de processus et d'interfaces simples. Vous pouvez créer les types de modèles suivants pour vos problèmes de données tabulaires :
- Les modèles de classification binaire prédisent un résultat binaire (l'une des deux classes). Utilisez ce type de modèle pour les questions fermées, c'est-à-dire dont la réponse peut être "oui" ou "non". Par exemple, vous pouvez créer un modèle de classification binaire pour prédire si un client achètera un abonnement. En règle générale, un problème de classification binaire nécessite moins de données que les autres types de modèle.
- Les modèles de classification à classes multiples prédisent une classe à partir de trois classes distinctes ou plus. Utilisez ce type de modèle pour la catégorisation. Par exemple, en tant que revendeur, vous pouvez créer un modèle de classification à classes multiples pour segmenter les clients en différents personas.
- Les modèles de régression prédisent une valeur continue. Par exemple, en tant que revendeur, vous pouvez créer un modèle de régression pour prédire le montant qu'un client dépensera le mois prochain.
- Les modèles de prévision prédisent une séquence de valeurs. Par exemple, en tant que revendeur, vous souhaitez peut-être prévoir la demande quotidienne de vos produits pour les trois prochains mois afin de pouvoir anticiper convenablement les stocks de produits nécessaires.
Pour une introduction au machine learning avec des données tabulaires, consultez la page Présentation des données tabulaires. Pour en savoir plus sur les solutions Agent Platform, consultez les pages Solutions Agent Platform pour la classification et la régression et Solutions Agent Platform pour la prévision.
Un mot sur l'équité
Google s'engage à faire avancer la mise en place des pratiques d'IA responsables. À cette fin, nos produits de ML, y compris AutoML, sont conçus selon des principes de base tels que l'équité et le machine learning centré sur l'humain. Pour en savoir plus des bonnes pratiques de limitation des biais lors de la création de votre propre système de ML, consultez le guide sur l'inclusion dans le ML – AutoML.
Solutions Agent Platform pour la classification et la régression
Agent Platform propose les solutions suivantes pour la classification et la régression :
Workflow tabulaire pour AutoML de bout en bout
Le workflow tabulaire pour AutoML de bout en bout est un pipeline AutoML complet pour les tâches de classification et de régression. Il est semblable à l'API AutoML, mais vous permet de choisir les éléments à contrôler et les éléments à automatiser. Au lieu de disposer de contrôles pour la totalité du pipeline, vous disposez de contrôles pour chaque étape du pipeline. Ces contrôles du pipeline incluent les éléments suivants :
- Division des données
- Ingénierie des caractéristiques
- Recherche d'architecture
- Entraînement du modèle
- Assemblage du modèle
- Distillation du modèle
Avantages
- Il accepte les ensembles de données volumineux de plusieurs To et comportant jusqu'à 1 000 colonnes.
- Permet d'améliorer la stabilité et de réduire le temps d'entraînement en limitant l'espace de recherche des types d'architecture ou en ignorant la recherche d'architecture.
- Il permet d'améliorer la vitesse d'entraînement en sélectionnant manuellement le matériel utilisé pour l'entraînement et la recherche d'architecture.
- Permet de réduire la taille du modèle et d'améliorer la latence avec la distillation ou en modifiant la taille de l'ensemble.
- Chaque composant AutoML peut être inspecté dans une interface graphique de pipelines puissante qui vous permet de voir les tables de données transformées, les architectures de modèle évaluées et bien d'autres détails.
- Chaque composant AutoML offre une flexibilité et une transparence accrues, telles que la possibilité de personnaliser les paramètres et le matériel, d'afficher l'état des processus et les journaux, etc.
Pour en savoir plus sur les workflows tabulaires, consultez la page Workflows tabulaires sur Agent Platform. Pour en savoir plus sur le workflow tabulaire pour AutoML de bout en bout, consultez la page Workflow tabulaire pour AutoML de bout en bout.
Classification et régression avec AutoML
Agent Platform propose des pipelines intégrés entièrement gérés pour les tâches de classification ou de régression de bout en bout. Agent Platform recherche l'ensemble optimal d'hyperparamètres, entraîne plusieurs modèles avec plusieurs ensembles d'hyperparamètres, puis crée un seul modèle final à partir d'un ensemble des meilleurs modèles. Agent Platform prend en compte les réseaux de neurones et les arbres de décision à boosting pour les types de modèle.
Avantages
- Facile à utiliser : Agent Platform choisit le type de modèle, les paramètres du modèle et le matériel pour vous.
Pour en savoir plus, consultez la section Présentation de la classification et de la régression.
Solutions Agent Platform pour la prévision
Agent Platform propose les solutions suivantes pour la prévision :
- Workflow tabulaire pour les prévisions
- Prévision avec AutoML
- Prévision avec BigQuery ML ARIMA_PLUS
- Prévision avec Prophet
Workflow tabulaire pour les prévisions
Le workflow tabulaire pour les prévisions est le pipeline complet pour les tâches de prévision. Il est semblable à l' API AutoML, mais vous permet de choisir les éléments à contrôler et les éléments à automatiser. Au lieu de disposer de contrôles pour la totalité du pipeline, vous disposez de contrôles pour chaque étape du pipeline. Ces contrôles du pipeline incluent les éléments suivants :
- Division des données
- Ingénierie des caractéristiques
- Recherche d'architecture
- Entraînement du modèle
- Assemblage du modèle
Avantages
- Il accepte les ensembles de données volumineux d'une taille maximale de 1 To et comportant jusqu'à 200 colonnes.
- Permet d'améliorer la stabilité et de réduire le temps d'entraînement en limitant l'espace de recherche des types d'architecture ou en ignorant la recherche d'architecture.
- Il vous permet d'améliorer la vitesse d'entraînement en sélectionnant manuellement le matériel utilisé pour l'entraînement et la recherche d'architecture.
- Il vous permet de réduire la taille du modèle et d'améliorer la latence en modifiant la taille de l'ensemble.
- Chaque composant peut être inspecté dans une interface graphique de pipelines puissante qui vous permet de voir les tables de données transformées, les architectures de modèle évaluées et bien d'autres détails.
- Chaque composant offre une flexibilité et une transparence accrues, telles que la possibilité de personnaliser les paramètres et le matériel, d'afficher l'état des processus et les journaux, etc.
Pour en savoir plus sur les workflows tabulaires, consultez la page Workflows tabulaires sur Agent Platform. Pour en savoir plus sur le workflow tabulaire pour les prévisions, consultez la page Workflow tabulaire pour les prévisions.
Prévision avec AutoML
Agent Platform propose un pipeline intégré et entièrement géré pour les tâches de prévision de bout en bout. Agent Platform recherche l'ensemble optimal d'hyperparamètres, entraîne plusieurs modèles avec plusieurs ensembles d'hyperparamètres, puis crée un seul modèle final à partir d'un ensemble des meilleurs modèles. Vous pouvez choisir l'une des méthodes d'entraînement de modèles suivantes : Encodeur dense de séries temporelles (TiDE), Transformateur de fusion temporelle (TFT), AutoML, ou Seq2Seq+. Agent Platform ne prend en compte que les réseaux de neurones pour le type de modèle.
Avantages
- Facile à utiliser : Agent Platform choisit les paramètres et le matériel du modèle pour vous.
Pour en savoir plus, consultez la section Présentation des prévisions.
Prévision avec BigQuery ML ARIMA_PLUS
BigQuery ML ARIMA_PLUS est un modèle de prévision univarié. En tant que modèle statistique, il est plus rapide à entraîner qu'un modèle basé sur des réseaux de neurones. Nous vous recommandons d'entraîner un modèle BigQuery ML ARIMA_PLUS si vous devez effectuer de nombreuses itérations rapides d'entraînement de modèle ou si vous avez besoin d'une référence peu coûteuse pour évaluer d'autres modèles.
Comme Prophet, BigQuery ML ARIMA_PLUS tente de décomposer chaque série temporelle en tendances, saisons et jours fériés, ce qui génère une prévision à l'aide de l'agrégation des inférences de ces modèles. Cependant, l'une des nombreuses différences est que BQML ARIMA+ utilise ARIMA pour modéliser le composant de tendance, tandis que Prophet tente d'ajuster une courbe à l'aide d'un modèle logistique ou linéaire par fragment.
Google Cloud propose un pipeline pour l'entraînement d'un modèle BigQuery ML ARIMA_PLUS et un autre pour obtenir des inférences par lot à partir d'un modèle BigQuery ML ARIMA_PLUS. Les deux pipelines sont des instances de Vertex AI Pipelines provenant de Google Cloud Pipeline Components (GCPC).
Avantages
- Facile à utiliser : BigQuery choisit les paramètres et le matériel du modèle pour vous.
- Rapide : l'entraînement de modèle offre une référence peu coûteuse pour comparer d'autres modèles.
Pour en savoir plus, consultez la page Effectuer des prévisions avec ARIMA+.
Prévision avec Prophet
Prophet est un modèle de prévision géré par Meta. Consultez l'article sur Prophet pour obtenir des détails sur l'algorithme et la documentation pour en savoir plus sur la bibliothèque.
Comme BigQuery ML ARIMA_PLUS, Prophet tente de décomposer chaque série temporelle en tendances, saisons et jours fériés, afin de produire une prévision à l'aide de l'agrégation des inférences de ces modèles. Cependant, une différence importante est que BQML ARIMA+ utilise ARIMA pour modéliser le composant de tendance, tandis que Prophet tente d'ajuster une courbe à l'aide d'un modèle logistique ou linéaire par fragments.
Google Cloud propose un pipeline pour l'entraînement d'un modèle Prophet et un autre pour obtenir des inférences par lot à partir d'un modèle Prophet. Les deux pipelines sont des instances de Vertex AI Pipelines provenant de Google Cloud Pipeline Components (GCPC).
L'intégration de Prophet à Agent Platform vous permet d'effectuer les opérations suivantes :
- Utiliser la répartition des données et les stratégies de fenêtrage d'Agent Platform.
- Lire des données à partir de tables BigQuery ou de fichiers CSV stockés dans Cloud Storage. Agent Platform s'attend à ce que chaque ligne ait le même format que les prévisions Agent Platform.
Bien que Prophet soit un modèle multivarié, Agent Platform n'accepte qu'une version univariée de ce modèle.
Avantages
- Flexible : vous pouvez améliorer la vitesse d'entraînement en sélectionnant le matériel utilisé pour l'entraînement.
Pour en savoir plus, consultez Effectuer des prévisions avec Prophet.
Étapes suivantes
- Apprenez-en plus sur le machine learning avec des données tabulaires.
- Apprenez-en plus sur la classification et la régression avec AutoML.
- Apprenez-en plus sur la prévision avec AutoML.
- Découvrez comment effectuer des prévisions avec Prophet.
- Découvrez comment effectuer des prévisions avec BigQuery ML ARIMA_PLUS.
- Découvrez les workflows tabulaires.