Vector Search

Vector Search est un puissant moteur de recherche vectorielle basé sur une technologie révolutionnaire développée par Google Research. Grâce à l' ScaNN , Vector Search vous permet de créer des systèmes de recherche et de recommandation de nouvelle génération, ainsi que des applications d'IA générative.

Vous pouvez bénéficier des mêmes recherches et technologies que celles qui alimentent les principaux produits Google, y compris la recherche Google, YouTube et Google Play. Vous bénéficiez ainsi de l'évolutivité, de la disponibilité et des performances nécessaires pour gérer des ensembles de données volumineux et fournir des résultats ultra-rapides à l'échelle mondiale. Avec Vector Search, vous disposez d'une solution de niveau entreprise pour implémenter des fonctionnalités de recherche sémantique de pointe dans vos propres applications.

Démonstration en direct de Vector Search

Blog : Recherche multimodale avec Vector Search

Démonstration de Next 24 Infinite Nature

Démonstration Next 24 Infinite Nature

Infinite Fleurs : découvrez la créativité assistée par l'IA en pleine floraison

Infinite Fleurs : découvrez la créativité assistée par l'IA en pleine floraison

Démonstration en direct de Vector Search

Découvrez l'IA multimodale avec le manga ONE PIECE

Premiers pas

Démonstration interactive de Vector Search: découvrez la démonstration en direct pour obtenir un exemple réaliste de ce que la technologie de recherche vectorielle peut faire et commencer à utiliser Vector Search.

Guide de démarrage rapide de Vector Search : essayez Vector Search en 30 minutes en créant, en déployant et en interrogeant un index de recherche Vector Search à l'aide d'un exemple d'ensemble de données. Ce tutoriel couvre la configuration, la préparation des données, la création d'index, le déploiement, l'interrogation et le nettoyage.

Avant de commencer : préparez vos embeddings en choisissant et en entraînant un modèle, puis préparez vos données. Ensuite, choisissez un point de terminaison public ou privé pour déployer votre index de requête.

Tarifs et simulateur de coût de Vector Search: les tarifs de Vector Search incluent le coût des machines virtuelles utilisées pour héberger les index déployés, ainsi que les dépenses liées à la création et à la mise à jour des index. Même une configuration minimale (moins de 100 $ par mois) peut gérer un haut débit pour les cas d'utilisation de taille moyenne. Pour estimer vos coûts mensuels :

  1. Accédez au simulateur de coût Google Cloud.
  2. Cliquez sur Ajouter à l'estimation.
  3. Recherchez Gemini Enterprise Agent Platform.
  4. Cliquez sur le bouton Gemini Enterprise Agent Platform.
  5. Sélectionnez Gemini Enterprise Agent Platform Vector Search dans le menu déroulant Type de service.
  6. Conservez les paramètres par défaut ou configurez les vôtres. Le coût mensuel estimé s'affiche dans le panneau Détails des coûts.

Documentation

Cas d'utilisation et blogs

La technologie de recherche vectorielle devient un hub central pour les entreprises qui utilisent l'IA. Comme les bases de données relationnelles dans les systèmes informatiques, elle connecte divers éléments d'entreprise tels que des documents, du contenu, des produits, des utilisateurs, des événements et d'autres entités en fonction de leur pertinence. Au-delà de la recherche dans les médias conventionnels tels que les documents et les images, Vector Search peut également alimenter des recommandations intelligentes, faire correspondre les problèmes commerciaux avec des solutions et même lier les signaux IoT aux alertes de surveillance. Il s'agit d'un outil polyvalent essentiel pour naviguer dans le paysage croissant des données d'entreprise compatibles avec l'IA.

Recherche et récupération d'informations

Recherche / Récupération d'informations

Vector Search pour les systèmes de recommandation

Systèmes de recommandation

Comment la recherche vectorielle de Gemini Enterprise Agent Platform permet de débloquer des applications d'IA générative hautes performances: Vector Search alimente diverses applications, y compris le e-commerce, les systèmes RAG et les moteurs de recommandation, ainsi que les chatbots, la recherche multimodale search, et plus encore. La recherche hybride améliore encore les résultats pour les termes de niche. Des clients tels que Bloomreach, eBay et Mercado Libre utilisent Gemini Enterprise Agent Platform pour ses performances, son évolutivité et sa rentabilité, ce qui leur permet de bénéficier d'avantages tels que des recherches plus rapides et des conversions accrues.

**eBay utilise Vector Search pour les recommandations**: explique comment eBay utilise Vector Search pour son système de recommandation. Cette technologie permet à eBay de trouver des produits similaires dans son vaste catalogue, ce qui améliore l'expérience utilisateur.

**Mercari s'appuie sur la technologie de recherche vectorielle de Google pour créer une nouvelle place de marché**: explique comment Mercari utilise Vector Search pour améliorer sa nouvelle plate-forme de place de marché. Vector Search alimente les recommandations de la plate-forme, ce qui aide les utilisateurs à trouver plus efficacement les produits pertinents.

**Embeddings Gemini Enterprise Agent Platform pour le texte : ancrage des LLM simplifié**: se concentre sur l’ancrage des LLM à l’aide des embeddings Gemini Enterprise Agent Platform pour les données textuelles. Vector Search joue un rôle important dans la recherche de passages de texte pertinents qui garantissent que les réponses du modèle sont basées sur des informations factuelles.

**Qu'est-ce que la recherche multimodale : les LLM avec vision modifient les entreprises**: présente la recherche multimodale, qui combine les LLM avec la compréhension visuelle. Il explique comment Vector Search traite et compare les données textuelles et d'image, ce qui permet des expériences de recherche plus complètes.

Débloquez la recherche multimodale à grande échelle : combinez la puissance du texte et des images avec Gemini Enterprise Agent Platform: décrit la création d'un moteur de recherche multimodal avec Gemini Enterprise Agent Platform qui combine la recherche de texte et d'images à l'aide d'une méthode d'ensemble de classement réciproque biaisé pondéré. Cela améliore l'expérience utilisateur et fournit des résultats plus pertinents results.

**Soumettre la récupération profonde à un scaling à l'aide des outils de recommandation TensorFlow et de Vector Search**: explique comment créer un système de recommandation de playlists à l'aide des outils de recommandation TensorFlow et de Vector Search, en couvrant les modèles de récupération profonde, l'entraînement, le déploiement et le scaling.

L'IA générative en action

IA générative : récupération pour RAG et agents

**Gemini Enterprise Agent Platform et Denodo débloquent les données d'entreprise avec l'IA générative**: montre comment l'intégration de Gemini Enterprise Agent Platform à Denodo permet aux entreprises d'utiliser l'IA générative pour obtenir des insights à partir de leurs données. Vector Search est essentiel pour accéder et analyser efficacement les données pertinentes dans un environnement d'entreprise.

**Infinite Nature et la nature des secteurs : cette démonstration 'sauvage' montre les diverses possibilités de l'IA**: présente une démonstration qui illustre le potentiel de l'IA dans différents secteurs. Il utilise Vector Search pour alimenter les recommandations génératives et la recherche sémantique multimodale.

Infinite Fleurs : découvrez la créativité assistée par l'IA en pleine floraison: Infinite Fleurs de Google, une expérience d'IA utilisant Vector Search, les modèles Gemini, génère des bouquets de fleurs uniques en fonction des requêtes des utilisateurs. Cette technologie montre le potentiel de l'IA pour inspirer la créativité dans divers secteurs.

**LlamaIndex pour RAG sur Google Cloud**: explique comment utiliser LlamaIndex pour faciliter la génération augmentée par récupération (RAG) avec de grands modèles de langage. LlamaIndex utilise Vector Search pour récupérer des informations pertinentes à partir d'une base de connaissances, ce qui permet d'obtenir des réponses plus précises et plus appropriées d'un point de vue contextuel.

**RAG et ancrage sur Gemini Enterprise Agent Platform**: examine les techniques RAG et d'ancrage sur Gemini Enterprise Agent Platform. Vector Search permet d'identifier les informations d'ancrage pertinentes lors de la récupération, ce qui rend le contenu généré plus précis et plus fiable.

**Vector Search sur LangChain**: fournit un guide d'utilisation de Vector Search avec LangChain pour créer et déployer un index de base de données vectorielle pour les données textuelles, y compris les questions-réponses et le traitement des PDF.

Icône représentant l'analyse de données sur ordinateur

Informatique décisionnelle, analyse de données, surveillance, etc.

Activer l'IA en temps réel avec l'ingestion en flux continu dans Agent Platform: explore la mise à jour en flux continu dans Vector Search et explique comment elle fournit des fonctionnalités d'IA en temps réel. Cette technologie permet le traitement et l'analyse en temps réel des flux de données entrants.

Vous pouvez utiliser les ressources suivantes pour commencer à utiliser Vector Search :

Notebooks et solutions

Guide de démarrage rapide de Vector Search pour Agent Platform Premiers pas avec les embeddings de texte et la recherche vectorielle

Guide de démarrage rapide de Vector Search pour Agent Platform: fournit une présentation de Vector Search. Il est conçu pour les utilisateurs qui découvrent la plate-forme et souhaitent commencer rapidement.

Premiers pas avec les embeddings textuels et Vector Search: présente les embeddings textuels et la recherche vectorielle. Il explique comment ces technologies fonctionnent et comment elles peuvent être utilisées pour améliorer les résultats de recherche.

Tutoriel sur la recherche hybride avec Vector Search Moteur RAG Gemini avec Vector Search

Combiner la recherche sémantique et la recherche par mot clé : tutoriel sur la recherche hybride avec Gemini Enterprise Agent Platform Vector Search: Fournit des instructions sur l'utilisation de Vector Search pour la recherche hybride. Il décrit les étapes à suivre pour configurer un système de recherche hybride.

Moteur RAG sur Gemini Enterprise Agent Platform avec Vector Search: explore l'utilisation du moteur RAG avec Vector Search. Il présente les avantages de l'utilisation conjointe de ces deux technologies et fournit des exemples de leur utilisation dans des applications concrètes.

Infrastructure pour une application d'IA générative compatible avec RAG à l'aide de la plate-forme d'agents et de la recherche vectorielle Architecture Google Cloud

Infrastructure pour une application d'IA générative compatible avec RAG à l'aide de Gemini Enterprise Agent Platform et Vector Search: décrit l'architecture permettant de créer une application d'IA générative et RAG à l'aide de Vector Search, Cloud Run et Cloud Storage, en couvrant les cas d'utilisation, les choix de conception et les considérations clés.

Implémenter la récupération à deux tours pour la génération de candidats à grande échelle: fournit une architecture de référence qui vous montre comment implémenter un workflow de génération de candidats à deux tours de bout en bout avec Gemini Enterprise Agent Platform. Le framework de modélisation à deux tours est une technique de récupération puissante pour les cas d'utilisation de personnalisation, car il apprend la similarité sémantique entre deux entités différentes, telles que les requêtes Web et les éléments candidats.

Formation

**Premiers pas avec Vector Search et les embeddings** Vector Search permet de trouver des éléments similaires ou associés. Il peut être utilisé pour les recommandations, la recherche, les chatbots et la classification de texte. Le processus consiste à créer des embeddings, à les importer Google Cloud, et à les indexer pour les interroger. Cet atelier se concentre sur les embeddings textuels à l'aide de Gemini Enterprise Agent Platform, mais des embeddings peuvent être générés pour d'autres types de données.

Recherche vectorielle et embeddings Ce cours présente la recherche vectorielle et décrit comment l'utiliser afin de créer une application de recherche avec des API de grand modèle de langage (LLM) pour les embeddings. Il comprend des leçons conceptuelles sur Vector Search et les embeddings textuels, des démonstrations pratiques de création d'une recherche vectorielle sur Gemini Enterprise Agent Platform, ainsi qu'un atelier pratique.

Comprendre et appliquer les embeddings textuels L'API Embeddings de Gemini Enterprise Agent Platform génère des embeddings textuels, qui sont
des représentations numériques de texte utilisées pour des tâches telles que l'identification d'éléments similaires.

Dans ce cours, vous allez utiliser des embeddings textuels pour des tâches telles que la classification et la recherche sémantique, et combiner la recherche sémantique avec des LLM pour créer des systèmes de questions-réponses à l'aide de Gemini Enterprise Agent Platform.

Cours d'initiation au machine learning : embeddings Ce cours présente les embeddings de mots, en les comparant aux représentations creuses. Il explore les méthodes d'obtention d'embeddings et fait la distinction entre les embeddings statiques et contextuels.

Embeddings Gemini Enterprise Agent PlatformFournit une présentation de l'API Embeddings. Cas d'utilisation des embeddings textuels et multimodaux, ainsi que liens vers des ressources supplémentaires et des services associés. Google Cloud

API de classement Agent Search L'API de classement reclasse les documents en fonction de leur pertinence par rapport à une requête à l'aide d'un modèle de langage pré-entraîné, en fournissant des scores précis. Elle est idéale pour améliorer les résultats de recherche provenant de diverses sources, y compris Vector Search.

Feature Store Gemini Enterprise Agent PlatformVous permet de gérer et de diffuser des données de caractéristiques à l'aide de BigQuery comme source de données. Il provisionne des ressources pour la livraison en ligne, en agissant comme une couche de métadonnées pour diffuser les dernières valeurs de caractéristiques directement depuis BigQuery. Feature Store permet de récupérer instantanément les valeurs de caractéristiques pour les éléments renvoyés par Vector Store pour les requêtes.

Pipelines Agent Platform Les pipelines Agent Platform permettent d'automatiser, de surveiller et de gérer vos systèmes de ML sans serveur en orchestrant les workflows de ML avec des pipelines de ML. Vous pouvez exécuter par lot des pipelines de ML définis à l'aide des pipelines Kubeflow ou TensorFlow Extended (TFX). Les pipelines permettent de créer des pipelines automatisés pour générer des embeddings, créer et mettre à jour des index Vector Search, et former une configuration MLOps pour les systèmes de recherche et de recommandation de production.

Ressources détaillées

Améliorer votre cas d'utilisation d'IA générative avec les types de tâches et les embeddings Gemini Enterprise Agent Platform Se concentre sur l'amélioration des applications d'IA générative à l'aide des types de tâches et des embeddings Gemini Enterprise Agent Platform Vector Search peut être utilisé avec des embeddings de type de tâche pour améliorer le contexte et la précision du contenu généré en trouvant des informations plus pertinentes.

TensorFlow Recommenders Bibliothèque Open Source pour la création de systèmes de recommandation. Il simplifie le processus de la préparation des données au déploiement et est compatible avec la création de modèles flexibles. TFRS propose des tutoriels et des ressources, et permet de créer des modèles de recommandation sophistiqués.

TensorFlow Ranking TensorFlow Ranking est une bibliothèque Open Source permettant de créer des modèles d'apprentissage de classement (LTR) neuronaux évolutifs. Il est compatible avec diverses fonctions de perte et métriques de classement, avec des applications dans la recherche, la recommandation et d'autres domaines. La bibliothèque est activement développée par Google AI.

Présentation de ScaNN : recherche efficace de similarités vectorielles ScaNN de Google, un algorithme de recherche efficace de similarités vectorielles, utilise une nouvelle technique pour améliorer la précision et la vitesse de recherche des voisins les plus proches. Il surpasse les méthodes existantes et présente de nombreuses applications dans les tâches de machine learning nécessitant une recherche sémantique. Les efforts de recherche de Google couvrent divers domaines, y compris le ML de base et les impacts sociétaux de l'IA.

SOAR : nouveaux algorithmes pour une recherche vectorielle encore plus rapide avec ScaNN L'algorithme SOAR de Google améliore l'efficacité de Vector Search en introduisant une redondance contrôlée, ce qui permet des recherches plus rapides avec des index plus petits. SOAR attribue des vecteurs à plusieurs clusters, créant ainsi des chemins de recherche "de sauvegarde" pour améliorer les performances.


Premiers pas avec Vector Search à l'aide d'Agent Platform

Vector Search est un outil puissant pour créer des applications basées sur l'IA. Cette vidéo présente la technologie et fournit un guide pas à pas pour commencer.



Découvrez la recherche hybride avec Vector Search

Vector Search peut être utilisé pour la recherche hybride, ce qui vous permet de combiner la puissance de la recherche vectorielle avec la flexibilité et la vitesse d'un moteur de recherche conventionnel. Cette vidéo présente la recherche hybride et vous montre comment utiliser Vector Search pour la recherche hybride.



Vous utilisez déjà Vector Search ! Voici comment devenir un expert

Saviez-vous que vous utilisez probablement la recherche vectorielle tous les jours sans vous en rendre compte ? De la recherche de ce produit insaisissable sur les réseaux sociaux au suivi d'une chanson qui vous reste en tête, la recherche vectorielle est la magie de l'IA derrière ces expériences quotidiennes.



Le nouvel embedding de "type de tâche" de l'équipe DeepMind améliore la qualité de la recherche RAG

Améliorez la précision et la pertinence de vos systèmes RAG grâce aux nouveaux embeddings de type de tâche développés par l'équipe Google DeepMind. Regardez et découvrez les défis courants liés à la qualité de la recherche RAG et comment les embeddings de type de tâche peuvent combler efficacement l'écart sémantique entre les questions et les réponses, ce qui permet une récupération plus efficace et des performances RAG améliorées.

Terminologie de Vector Search

Cette liste contient certains termes clés que vous devez comprendre pour utiliser Vector Search :

  • Vecteur : un vecteur est une liste de valeurs flottantes ayant une magnitude et une direction. Il permet de représenter n'importe quel type de données, comme des nombres, des points dans l'espace et des directions.

  • Embedding : un embedding (ou "plongement") est un type de vecteur utilisé pour représenter les données de manière à capturer leur signification sémantique. Les représentations vectorielles continues sont généralement créées à l'aide de techniques de machine learning et sont souvent utilisées dans le traitement du langage naturel (TLN) et d'autres applications de machine learning.

    • Embeddings denses : les embeddings denses représentent la signification sémantique du texte à l'aide de tableaux contenant principalement des valeurs non nulles. Avec les embeddings denses, des résultats de recherche similaires peuvent être renvoyés en fonction de la similarité sémantique.

    • Embeddings clairsemés : les embeddings clairsemés représentent la syntaxe du texte à l'aide de tableaux à haute dimensionnalité contenant très peu de valeurs non nulles par rapport aux embeddings denses. Les embeddings clairsemés sont souvent utilisés pour les recherches par mot clé.

  • Recherche hybride : la recherche hybride utilise des embeddings denses et clairsemés, ce qui vous permet de combiner la recherche par mot clé et la recherche sémantique. Vector Search est compatible avec la recherche basée sur des embeddings denses, des embeddings clairsemés et la recherche hybride.

  • Index : ensemble de vecteurs déployés pour la recherche de similarités. Les vecteurs peuvent être ajoutés à un index ou supprimés de celui-ci. Les requêtes de recherche de similarités sont émises sur un index spécifique et recherchent les vecteurs de cet index.

  • Vérité terrain : terme faisant référence à la vérification de l'exactitude du machine learning par rapport au monde réel (par exemple, un ensemble de données de vérité terrain).

  • Rappel : pourcentage de voisins les plus proches renvoyés par l'index qui sont de vrais voisins les plus proches. Par exemple, si une requête de 20 voisins les plus proches renvoie un résultat de 19 voisins les plus proches de "vérité terrain", le rappel est de 19/20 x 100 = 95%.

  • Restreindre : fonctionnalité qui limite les recherches à un sous-ensemble de l'index à l'aide de règles booléennes. La restriction est également appelée "filtrage". Vector Search vous permet d'utiliser le filtrage numérique et le filtrage des attributs de texte.