Dans le machine learning (ML), les caractéristiques sont des attributs caractéristiques d'une instance ou d'une entité que vous pouvez utiliser pour entraîner des modèles ou pour effectuer des prédictions en ligne. Les caractéristiques sont générées en transformant les données de ML brutes en attributs mesurables et partageables à l'aide de techniques d'ingénierie des caractéristiques, généralement appelées transformations de caractéristiques.
La gestion des caractéristiques fait référence au processus de création, de maintenance, de partage et de diffusion des caractéristiques de ML stockées dans un emplacement ou un dépôt centralisé. La gestion des caractéristiques facilite la réutilisation des caractéristiques pour entraîner et réentraîner des modèles, réduisant ainsi le cycle de vie des déploiements d'IA et de ML.
Un produit ou service incluant des services de gestion des caractéristiques pour stocker, découvrir, partager et diffuser des caractéristiques de ML est appelé un magasin de caractéristiques. Vertex AI intègre les services de magasin de caractéristiques suivants :
Cette page présente et compare les deux services de gestion des caractéristiques et présente leurs fonctionnalités. Elle explique également comment migrer un magasin de caractéristiques existant dans Vertex AI Feature Store (ancien) vers le nouveau Vertex AI Feature Store.
Vertex AI Feature Store
Vertex AI Feature Store propose une nouvelle approche de gestion des caractéristiques en vous permettant de gérer et de diffuser vos données de caractéristiques à partir d'une source de données BigQuery. Dans cette approche, Vertex AI Feature Store agit comme une couche de métadonnées qui fournit des fonctionnalités de diffusion en ligne à votre source de données de caractéristiques dans BigQuery et vous permet de diffuser des caractéristiques en ligne en fonction de ces données. Vous n'avez pas besoin de copier ni d'importer les données dans un magasin hors connexion distinct dans Vertex AI.
Vertex AI Feature Store est intégré à Dataplex Universal Catalog pour suivre les métadonnées de caractéristiques. Il est également compatible avec les embeddings et vous permet d'effectuer des recherches de similarités vectorielles pour les voisins les plus proches.
Vertex AI Feature Store est optimisé pour la diffusion à très faible latence et vous permet d'effectuer les opérations suivantes :
Stockez et gérez vos données de caractéristiques hors connexion dans BigQuery, en tirant parti des fonctionnalités de gestion des données de BigQuery.
Partager et réutiliser des caractéristiques en les ajoutant au registre de caractéristiques
Diffusez des caractéristiques pour les prédictions en ligne à faible latence à l'aide de la diffusion en ligne Bigtable.
Suivez les métadonnées de caractéristiques dans Dataplex Universal Catalog.
Pour en savoir plus sur Vertex AI Feature Store, consultez la documentation sur Vertex AI Feature Store.
Vertex AI Feature Store (ancien)
Vertex AI Feature Store (ancien) fournit un dépôt centralisé pour stocker, organiser et diffuser les données de caractéristiques de ML. Il provisionne une hiérarchie de ressources qui encapsule à la fois un magasin en ligne et un magasin hors connexion au sein de Vertex AI. Le magasin en ligne diffuse les valeurs de caractéristiques les plus récentes pour les prédictions en ligne. Le magasin hors connexion stocke et gère les données de caractéristiques (y compris les données historiques) que vous pouvez diffuser par lot pour l'entraînement de modèles de ML.
Vertex AI Feature Store (ancien) est un service de gestion des caractéristiques entièrement fonctionnel qui vous permet d'effectuer les opérations suivantes :
Importez des données de caractéristiques par lots ou par flux dans un magasin hors connexion à partir d'une source de données, telle qu'un bucket Cloud Storage ou une source BigQuery.
Diffusez des caractéristiques en ligne pour les prédictions.
Diffusez ou exportez des caractéristiques par lots pour l'entraînement ou l'analyse des modèles de ML.
Définissez des stratégies de gestion de l'authentification et des accès (IAM) sur les ressources
EntityTypeetFeaturestore.Gérez les ressources du feature store depuis la console Google Cloud .
Vertex AI Feature Store (ancien) n'inclut pas les fonctionnalités de gestion des embeddings ni de récupération vectorielle. Si vous devez gérer les embeddings dans vos données de caractéristiques, envisagez d'utiliser Vector Search. Si vous devez effectuer des recherches de similarité vectorielle, passez à Vertex AI Feature Store. Pour en savoir plus sur la migration vers Vertex AI Feature Store, consultez Migrer vers Vertex AI Feature Store.
Pour en savoir plus sur Vertex AI Feature Store (ancien), consultez la documentation sur Vertex AI Feature Store (ancien).
Migrer vers Vertex AI Feature Store
Vertex AI Feature Store (ancien) est obsolète. Si vous utilisez déjà Vertex AI Feature Store (ancien) et que vous souhaitez migrer votre projet vers Vertex AI Feature Store, procédez comme suit. Notez que la hiérarchie des ressources dans Vertex AI Feature Store est différente de celle dans Vertex AI Feature Store (ancien). Vous devrez donc créer manuellement les ressources après la migration des données de caractéristiques.
Si vos données de caractéristiques ne sont pas déjà disponibles dans BigQuery, exportez-les vers BigQuery, puis créez des tables et des vues BigQuery. Suivez les consignes de préparation des données lorsque vous exportez et préparez les données. Exemple :
Chaque caractéristique correspond à une colonne. Les ID d'entité peuvent être une colonne distincte, que vous pouvez identifier en tant que colonne
ID.Vertex AI Feature Store ne dispose pas des ressources
EntityTypeetEntity. Indiquez les valeurs de caractéristiques pour chaque entité dans la ligne correspondant à l'ID d'entité.
Facultatif : Enregistrez votre source de données de caractéristiques en ajoutant des groupes de caractéristiques et des caractéristiques. Pour en savoir plus, consultez les pages Créer un groupe de caractéristiques et Créer une caractéristique.
Configurez la diffusion en ligne en créant des instances de magasin en ligne et de vue des caractéristiques en fonction des données de la caractéristique.