Vector Search 2.0

Vector Search 2.0 est un produit Google Cloud conçu dès le départ comme un moteur de recherche auto-réglable, entièrement géré et natif de l'IA. Alors que le service Vector Search existant de Google Cloudest un puissant système d'indexation en tant que service de voisin le plus proche approximatif (ANN), Vector Search 2.0 transforme ce concept en un système complet de stockage et de récupération. Au lieu de gérer les index comme ressource principale, vous travaillerez avec des collections d'objets de données.

L'architecture du moteur de recherche fournit un moteur de stockage répliqué et évolutif, ce qui fait de Vector Search 2.0 une source de données unique et unifiée pour vos applications d'IA, et élimine le besoin de stockage de données auxiliaires.

Voici les principaux avantages de cette nouvelle architecture :

  • Convivialité pour les développeurs : commencez rapidement avec des bibliothèques clientes intuitives qui nécessitent un minimum de code. Le système est réglé automatiquement pour maintenir des performances élevées, en faisant abstraction de l'infrastructure sous-jacente afin que vous n'ayez pas à configurer de VM ni de répliques.

  • Intégration et évaluation rapides : créez des collections, ajoutez vos données et commencez à effectuer des recherches rapidement.

  • Stockage de données unifié : stockez, récupérez et filtrez vos documents par similarité vectorielle et données utiles, le tout au même endroit.

  • Fonctionnalités puissantes : remplissez automatiquement les champs d'embedding à l'aide de modèles intégrés, explorez vos données grâce à des fonctionnalités de requête avancées, apportez vos propres embeddings (BYOE) et créez rapidement des index pour améliorer les performances.

  • Tarification simplifiée : la tarification adaptable propose deux modèles : basé sur l'utilisation pour les charges de travail plus petites et basé sur les ressources pour des performances optimisées.

Vector Search 2.0 conserve les hautes performances et l'évolutivité massive de Vector Search 1.0, ce qui facilite le démarrage et la mise à l'échelle.

Concepts

Avant de commencer, il est utile de comprendre les concepts suivants de Vector Search 2.0 :

  • Collection : conteneur pour un ensemble d'objets JSON associés. Cela s'apparente à une table dans une base de données relationnelle. Vous pouvez créer plusieurs collections dans une même base de données.

  • Objet de données : objet JSON individuel stocké dans une collection.

  • Collection: schema: définit la structure et les contraintes des objets de données d'une collection. Il peut être configuré pour les validations de schéma strictes et souples.

  • Index de la collection : permet une recherche efficace des voisins approximatifs les plus proches (ANN) dans les objets de données d'une collection. Une collection peut comporter plusieurs index, par exemple un pour chaque champ vectoriel de vos objets de données.

Étape suivante