Types de diffusion en ligne

Vertex AI Feature Store propose les types de diffusion en ligne suivants, que vous pouvez utiliser pour diffuser des caractéristiques pour les prédictions en ligne :

Diffusion en ligne Bigtable

La livraison en ligne Bigtable convient aux volumes de données importants (de l'ordre de plusieurs téraoctets de données) avec une grande durabilité des données. Elle est comparable à la diffusion en ligne dans Vertex AI Feature Store (ancien), mais n'est pas optimisée pour s'adapter rapidement aux pics de trafic soudains.

En règle générale, la diffusion en ligne Bigtable offre une latence plus élevée que la diffusion en ligne optimisée, mais elle est plus rentable. La diffusion en ligne Bigtable est compatible avec la synchronisation des données planifiée et continue pour ses vues de caractéristiques.

Notez que la diffusion en ligne Bigtable n'est pas compatible avec la gestion des embeddings. Si vous souhaitez gérer et diffuser des embeddings, utilisez la diffusion en ligne optimisée.

Pour utiliser la diffusion en ligne Bigtable, vous devez effectuer les étapes suivantes :

  1. Créer un stockage en ligne pour la diffusion en ligne Bigtable.

  2. Créer une instance de vue de caractéristiques.

  3. Récupérer les valeurs de caractéristiques à l'aide de la diffusion en ligne Bigtable.

Diffusion en ligne optimisée

La livraison en ligne optimisée vous permet de diffuser des caractéristiques avec des latences nettement inférieures à celles de la livraison en ligne Bigtable. Elle fournit une architecture de diffusion en ligne plus rapide, plus évolutive et plus réactive à la hausse des volumes de données. La livraison en ligne optimisée est adaptée aux scénarios dans lesquels il est essentiel de livrer les caractéristiques avec des latences ultra-faibles.

Avec la diffusion en ligne optimisée, vous pouvez diffuser des valeurs de caractéristiques à partir d'un point de terminaison public ou d'un point de terminaison Private Service Connect.

Toutes les instances de magasin en ligne créées pour la diffusion en ligne optimisée sont compatibles avec la gestion des embeddings.

La diffusion en ligne optimisée est compatible avec la synchronisation de données planifiée, mais pas avec la synchronisation de données continue pour les vues de caractéristiques. Si vous souhaitez utiliser la synchronisation de données continue pour synchroniser les données de la source de données BigQuery avec vos vues d'éléments géographiques en quasi temps réel, utilisez la diffusion en ligne Bigtable.

Diffusion en ligne optimisée avec un point de terminaison public

Par défaut, un magasin en ligne créé pour la livraison en ligne optimisée vous permet de livrer des caractéristiques avec un point de terminaison public. Pour utiliser la livraison en ligne optimisée avec un point de terminaison public, vous devez effectuer les étapes suivantes :

  1. Créer un magasin en ligne pour la livraison en ligne optimisée avec un point de terminaison public

  2. Créer une instance de vue de caractéristiques.

  3. Récupérer les valeurs de caractéristiques à l'aide de la livraison en ligne optimisée à partir d'un point de terminaison public

Diffusion en ligne optimisée avec un point de terminaison Private Service Connect

Un point de terminaison Private Service Connect est un point de terminaison de diffusion dédié. Utilisez un point de terminaison Private Service Connect si vous souhaitez diffuser des caractéristiques dans un réseau VPC avec des latences inférieures à un point de terminaison public. Pour utiliser la livraison en ligne optimisée avec un point de terminaison Private Service Connect, vous devez effectuer les étapes suivantes :

  1. Créer un magasin en ligne pour la livraison en ligne optimisée avec un point de terminaison Private Service Connect

  2. Créer une instance de vue de caractéristiques.

  3. Récupérer les valeurs de caractéristiques à l'aide de la livraison en ligne optimisée à partir du point de terminaison Private Service Connect

Configurer la diffusion en ligne pour diffuser des valeurs de caractéristiques nulles ou uniquement des valeurs de caractéristiques non nulles

Lors de la diffusion en ligne, si vous ne souhaitez diffuser que les dernières valeurs de caractéristiques, y compris les valeurs nulles, vous devez utiliser la configuration suivante:

  1. Enregistrez votre source de données de caractéristiques en créant un groupe de caractéristiques avec le paramètre dense défini sur true.

  2. Choisissez la diffusion en ligne Bigtable lorsque vous créez l'instance de magasin en ligne.

  3. Utilisez le paramètre cron pour configurer la synchronisation planifiée des données lorsque vous créez vos vues d'éléments géographiques.

Si vous utilisez une autre configuration lors de la configuration de votre source de données de caractéristiques et de la diffusion en ligne, Vertex AI Feature Store ne diffuse que les dernières valeurs de caractéristiques non nulles. Si la dernière valeur d'une caractéristique est nulle, Vertex AI Feature Store diffuse la valeur historique non nulle la plus récente pour la caractéristique. Si une valeur historique non nulle n'est pas disponible, Vertex AI Feature Store utilise la valeur "null" comme valeur de la caractéristique.

Étape suivante