Vektorsuche

Die Vektorsuche ist eine leistungsstarke Vektorsuchmaschine, die auf bahnbrechender Technologie von Google Research basiert. Mit dem ScaNN Algorithmus können Sie mit der Vektorsuche Such- und Empfehlungssysteme der nächsten Generation sowie Anwendungen mit generativer KI erstellen.

Sie profitieren von derselben Forschung und Technologie, die auch in den wichtigsten Google-Produkten wie der Google Suche, YouTube und Google Play zum Einsatz kommen. Das bedeutet, dass Sie die Skalierbarkeit, Verfügbarkeit und Leistung erhalten, die für die Verarbeitung riesiger Datasets und die Bereitstellung blitzschneller Ergebnisse im globalen Maßstab erforderlich sind. Mit der Vektorsuche erhalten Sie eine Lösung für Unternehmen, mit der Sie modernste semantische Suchfunktionen in Ihren eigenen Anwendungen implementieren können.

Live-Demo zur Vektorsuche

Blog: Multimodale Suche mit der Vektorsuche

Next 24 – Demo „Infinite Nature“

Next 24 Infinite Nature Demo

Infinite Fleurs: KI-gestützte Kreativität in voller Blüte

Infinite Fleurs: KI-gestützte Kreativität in voller Blüte

Live-Demo zur Vektorsuche

Multimodale KI mit dem Manga ONE PIECE

Jetzt starten

Interaktive Demo der Vektorsuche: In der Live-Demo sehen Sie ein realistisches Beispiel dafür, was die Vektorsuchtechnologie leisten kann, und erhalten einen Vorsprung bei der Vektorsuche.

Kurzanleitung zur Vektorsuche: Testen Sie die Vektorsuche in 30 Minuten, indem Sie mit einem Beispieldatensatz einen Vektorsuchindex erstellen, bereitstellen und abfragen. In dieser Anleitung werden Einrichtung, Datenvorbereitung, Indexerstellung, Bereitstellung, Abfrage und Bereinigung behandelt.

Vorbereitung: Bereiten Sie Ihre Einbettungen vor, indem Sie ein Modell auswählen und trainieren und Ihre Daten vorbereiten. Wählen Sie dann einen öffentlichen oder privaten Endpunkt aus, auf dem Sie Ihren Abfrageindex bereitstellen möchten.

Preise und Preisrechner für die Vektorsuche: Die Preise für die Vektorsuche umfassen die Kosten für virtuelle Maschinen, die zum Hosten bereitgestellter Indexe verwendet werden, sowie die Kosten für das Erstellen und Aktualisieren von Indexen. Selbst bei einer minimalen Einrichtung (unter 100 $pro Monat) kann ein hoher Durchsatz für Anwendungsfälle mit mittlerer Größe erzielt werden. So schätzen Sie Ihre monatlichen Kosten:

  1. Rufen Sie den Preisrechner von Google Cloud auf.
  2. Klicken Sie auf Der Schätzung hinzufügen.
  3. Suchen Sie nach Vertex AI.
  4. Klicken Sie auf die Schaltfläche Vertex AI.
  5. Wählen Sie im Drop-down-Menü Diensttyp die Option Vektorsuche in Vertex AI aus.
  6. Behalten Sie die Standardeinstellungen bei oder konfigurieren Sie eigene Einstellungen. Die geschätzten Kosten pro Monat werden im Bereich Kostendetails angezeigt.

Dokumentation

Anwendungsfälle und Blogs

Die Vektorsuchtechnologie wird zu einem zentralen Knotenpunkt für Unternehmen, die KI nutzen. Ähnlich wie relationale Datenbanken in IT-Systemen verbindet sie verschiedene Geschäftselemente wie Dokumente, Inhalte, Produkte, Nutzer, Ereignisse und andere Entitäten basierend auf ihrer Relevanz. Neben der Suche in herkömmlichen Medien wie Dokumenten und Bildern kann die Vektorsuche auch intelligente Empfehlungen liefern, Geschäftsprobleme mit Lösungen abgleichen und sogar IoT-Signale mit Überwachungsbenachrichtigungen verknüpfen. Sie ist ein vielseitiges Tool, das für die Navigation in der wachsenden Landschaft von KI-fähigen Unternehmensdaten unerlässlich ist.

Suchen und Abrufen von Informationen

Suche / Informationsabruf

Vektorsuche für Empfehlungssysteme

Empfehlung
Systeme

So können Sie mit der Vektorsuche in Vertex AI leistungsstarke generative KI-Anwendungen erstellen: Die Vektorsuche unterstützt verschiedene Anwendungen, darunter E-Commerce, RAG-Systeme und Empfehlungssysteme sowie Chatbots, multimodale Suche und mehr. Die Hybridsuche verbessert die Ergebnisse für Nischenbegriffe weiter. Kunden wie Bloomreach, eBay und Mercado Libre nutzen Vertex AI aufgrund seiner Leistung, Skalierbarkeit und Kosteneffizienz und profitieren von Vorteilen wie schnelleren Suchvorgängen und höheren Conversion-Raten.

**eBay verwendet die Vektorsuche für Empfehlungen**: Hier wird beschrieben, wie eBay die Vektorsuche für sein Empfehlungssystem nutzt. Mit dieser Technologie kann eBay ähnliche Produkte in seinem umfangreichen Katalog finden und so die Nutzerfreundlichkeit verbessern.

**Mercari nutzt die Vektorsuchtechnologie von Google, um einen neuen Marktplatz zu erstellen**: Hier wird erläutert, wie Mercari die Vektorsuche nutzt, um seine neue Marktplatzplattform zu verbessern. Die Vektorsuche unterstützt die Empfehlungen der Plattform und hilft Nutzern, relevante Produkte effektiver zu finden.

Vertex AI Embeddings for Text: LLMs fundieren leicht gemacht: Hier geht es um die Fundierung von LLMs mit Vertex AI Embeddings für Textdaten. Die Vektorsuche spielt eine wichtige Rolle bei der Suche nach relevanten Text Passagen, die dafür sorgen, dass die Antworten des Modells auf Fakten basieren.

Was ist die multimodale Suche? „LLMs mit Vision“ verändern Unternehmen: Hier wird die multimodale Suche behandelt, bei der LLMs mit visuellem Verständnis kombiniert werden. Es wird erläutert, wie die Vektorsuche sowohl Text als auch Bilddaten verarbeitet und vergleicht, um umfassendere Suchergebnisse zu ermöglichen.

Multimodale Suche im großen Maßstab: Text- und Bildfunktionen mit Vertex AI kombinieren: Hier wird beschrieben, wie Sie mit Vertex AI eine multimodale Suchmaschine erstellen, die Text- und Bildsuche mit einer gewichteten Rank-Biased Reciprocal Rank-Ensemble-Methode kombiniert. Dadurch wird die Nutzerfreundlichkeit verbessert und relevantere Ergebnisse erzielt.

**Deep Retrieval mit TensorFlow Recommenders und der Vektorsuche skalieren**: Hier wird erläutert, wie Sie mit TensorFlow Recommenders und der Vektorsuche ein Empfehlungssystem für Wiedergabelisten erstellen. Dabei werden Deep Retrieval-Modelle, Training, Bereitstellung und Skalierung behandelt.

Generative KI im Einsatz

Generative KI: Abruf für RAG und Agents

Mit Vertex AI und Denodo Unternehmensdaten mit generativer KI erschließen: Hier wird gezeigt, wie Unternehmen durch die Integration von Vertex AI in Denodo generative KI nutzen können, um Erkenntnisse aus ihren Daten zu gewinnen. Die Vektorsuche ist entscheidend für den effizienten Zugriff auf relevante Daten und deren Analyse in einer Unternehmensumgebung.

**Infinite Nature und die Natur der Branchen: Diese „wilde“ Demo zeigt die vielfältigen Möglichkeiten von KI**: Hier wird eine Demo vorgestellt, die das Potenzial von KI in verschiedenen Branchen veranschaulicht. Dabei wird die Vektorsuche verwendet, um generative Empfehlungen und multimodale semantische Suche zu ermöglichen.

Infinite Fleurs: KI-gestützte Kreativität in voller Blüte: Infinite Fleurs von Google ist ein KI-Experiment, bei dem mit der Vektorsuche sowie den Gemini- und Imagen-Modellen einzigartige Blumensträuße auf der Grundlage von Nutzerprompts generiert werden. Diese Technologie zeigt das Potenzial von KI, die Kreativität in verschiedenen Branchen zu fördern.

LlamaIndex für RAG in Google Cloud: Hier wird beschrieben, wie Sie LlamaIndex verwenden können, um die Retrieval-Augmented Generation (RAG) mit Large Language Models zu erleichtern. LlamaIndex nutzt die Vektorsuche um relevante Informationen aus einer Wissensdatenbank abzurufen, was zu genaueren und kontextbezogeneren Antworten führt.

**RAG und Fundierung in Vertex AI**: Hier werden RAG- und Fundierungstechniken in Vertex AI untersucht. Die Vektorsuche hilft, relevante Fundierungsinformationen während des Abrufs zu identifizieren, wodurch generierte Inhalte genauer und zuverlässiger werden.

**Vektorsuche in LangChain**: Hier finden Sie eine Anleitung zur Verwendung der Vektorsuche mit LangChain zum Erstellen und Bereitstellen eines Vektordatenbankindex für Textdaten, einschließlich Question Answering und PDF-Verarbeitung.

Symbol: Computerdatenanalyse

BI, Datenanalyse, Monitoring und mehr

KI in Echtzeit mit Streamingaufnahme in Vertex AI ermöglichen: Hier wird die Streamingaktualisierung in der Vektorsuche untersucht und erläutert, wie sie KI-Funktionen in Echtzeit bietet. Mit dieser Technologie können eingehende Datenstreams in Echtzeit verarbeitet und analysiert werden.

Die folgenden Ressourcen können Ihnen den Einstieg in die Vektorsuche erleichtern:

Notebooks und Lösungen

Kurzanleitung für die Vektorsuche in Vertex AI Erste Schritte mit Texteinbettungen und Vektorsuche

**Kurzanleitung zur Vektorsuche in Vertex AI**: Hier finden Sie eine Übersicht über die Vektorsuche. Sie ist für Nutzer gedacht, die neu auf der Plattform sind und schnell loslegen möchten.

Erste Schritte mit Texteinbettungen und der Vektorsuche: Hier werden Texteinbettungen und die Vektorsuche vorgestellt. Es wird erläutert, wie diese Technologien funktionieren und wie sie zur Verbesserung der Suchergebnisse eingesetzt werden können.

Anleitung zur Hybridsuche mit der Vektorsuche Gemini RAG Engine mit Vektorsuche

Semantische Suche und Keyword-Suche kombinieren: Anleitung zur Hybridsuche mit der Vektorsuche in Vertex AI Vektorsuche: Hier finden Sie eine Anleitung zur Verwendung der Vektorsuche für die Hybridsuche. Dabei werden die Schritte zum Einrichten und Konfigurieren eines Hybrid Suchsystems behandelt.

**Vertex AI RAG Engine mit der Vektorsuche**: Hier wird die Verwendung der Vertex AI RAG Engine mit der Vektorsuche untersucht. Es werden die Vorteile der gemeinsamen Verwendung dieser beiden Technologien erläutert und Beispiele dafür gegeben, wie sie in realen Anwendungen eingesetzt werden können.

Infrastruktur für eine RAG-fähige generative KI-Anwendung mit Vertex AI und Vektorsuche Die Google Cloud-Architektur

Infrastruktur für eine RAG-fähige generative KI-Anwendung mit Vertex AI und der Vektorsuche: Hier wird die Architektur für die Erstellung einer generativen KI-Anwendung und RAG mit der Vektorsuche, Cloud Run und Cloud Storage beschrieben. Dabei werden Anwendungsfälle, Designentscheidungen und wichtige Überlegungen behandelt.

Two-Tower-Abruf für die Kandidatengenerierung im großen Maßstab implementieren: Hier finden Sie eine Referenzarchitektur, die zeigt, wie Sie mit Vertex AI einen End-to-End-Workflow zur Kandidatengenerierung mit zwei Towern implementieren. Das Two-Tower-Modellierungsframework ist eine leistungsstarke Abruftechnik für Anwendungsfälle zur Personalisierung, da es die semantische Ähnlichkeit zwischen zwei verschiedenen Entitäten lernt, z. B. Webabfragen und Kandidatenelementen.

Training

Erste Schritte mit der Vektorsuche und Einbettungen : Die Vektorsuche wird verwendet, um ähnliche oder verwandte Elemente zu finden. Sie kann für Empfehlungen, Suche, Chatbots und Textklassifizierung eingesetzt werden. Dabei werden Einbettungen erstellt, hochgeladen Google Cloudund für die Abfrage indexiert. In diesem Lab geht es um Texteinbettungen mit Vertex AI, aber Einbettungen können auch für andere Datentypen generiert werden.

Vektorsuche und Einbettungen In diesem Kurs werden die Vektorsuche vorgestellt und beschrieben, wie sie beim Erstellen einer Suchanwendung mit Large Language Model-APIs (LLM) für Einbettungen genutzt werden kann. Der Kurs besteht aus konzeptionellen Lektionen über Vektorsuche und Texteinbettungen, interaktiven Demos zum Erstellen einer Vektorsuche in Vertex AI und einem Übungslab.

Texteinbettungen verstehen und anwenden Die Vertex AI Embeddings API generiert Texteinbettungen, die
numerische Darstellungen von Text sind, die für Aufgaben wie die Identifizierung ähnlicher Elemente verwendet werden.

In diesem Kurs verwenden Sie Texteinbettungen für Aufgaben wie Klassifizierung und semantische Suche und kombinieren die semantische Suche mit LLMs, um mit Vertex AI Question Answering-Systeme zu erstellen.

**Crashkurs „Maschinelles Lernen“: Einbettungen** : In diesem Kurs werden Worteinbettungen vorgestellt und mit dünnbesetzten Darstellungen verglichen. Es werden Methoden zum Erhalten von Einbettungen untersucht und zwischen statischen und kontextbezogenen Einbettungen unterschieden.

**Vertex AI Embeddings** : Hier finden Sie eine Übersicht über die Embeddings API. Anwendungsfälle für Text- und multimodale Einbettungen, sowie Links zu zusätzlichen Ressourcen und verwandten Google Cloud Diensten.

Vertex AI Search Ranking API Die Ranking API ordnet Dokumente anhand ihrer Relevanz für eine Abfrage mit einem vorab trainierten Language Model neu an und liefert präzise Ergebnisse. Sie eignet sich ideal zur Verbesserung der Suchergebnisse aus verschiedenen Quellen, einschließlich der Vektorsuche.

**Vertex AI Feature Store** : Hier können Sie Featuredaten mit BigQuery als Datenquelle verwalten und bereitstellen. Er stellt Ressourcen für die Onlinebereitstellung bereit und fungiert als Metadatenebene, um die neuesten Featurewerte direkt aus BigQuery bereitzustellen. Mit Feature Store können Featurewerte für die Elemente, die Vector Store für Abfragen zurückgegeben hat, sofort abgerufen werden.

Vertex AI Pipelines Vertex AI Pipelines: Mit Vertex AI Pipelines können Sie Ihre ML-Systeme serverlos automatisieren, überwachen und steuern, indem Sie ML-Workflows mit ML Pipelines orchestrieren. Sie können ML-Pipelines, die mit Kubeflow Pipelines oder dem TensorFlow Extended (TFX)-Framework definiert wurden, in Batches ausführen. Mit Pipelines können Sie automatisierte Pipelines erstellen, um Einbettungen zu generieren, Vektorsuchindexe zu erstellen und zu aktualisieren und eine MLOps-Einrichtung für Produktionssuch- und Empfehlungssysteme zu erstellen.

Ressourcen für detaillierte Informationen

Enhancing Your Gen AI Use Case with Vertex AI Embeddings and Task Types : Hier geht es um die Verbesserung von Anwendungen mit generativer KI mithilfe von Vertex AI Embeddings und Aufgabentypen. Die Vektorsuche kann mit Einbettungen des Aufgabentyps verwendet werden, um den Kontext und die Genauigkeit generierter Inhalte zu verbessern, indem relevantere Informationen gefunden werden.

TensorFlow Recommenders Eine Open-Source-Bibliothek zum Erstellen von Empfehlungssystemen. Sie vereinfacht den Prozess von der Datenvorbereitung bis zur Bereitstellung und unterstützt die flexible Modellerstellung. TFRS bietet Anleitungen und Ressourcen und ermöglicht die Erstellung komplexer Empfehlungsmodelle.

TensorFlow Ranking TensorFlow Ranking ist eine Open-Source-Bibliothek zum Erstellen skalierbarer neuronaler Learning-to-Rank-Modelle (LTR). Sie unterstützt verschiedene Verlustfunktionen und Ranking-Messwerte und kann in der Suche, bei Empfehlungen und in anderen Bereichen eingesetzt werden. Die Bibliothek wird aktiv von Google AI entwickelt.

Ankündigung von ScaNN: Effiziente Suche nach Vektorähnlichkeiten ScaNN von Google ist ein Algorithmus für die effiziente Suche nach Vektorähnlichkeiten, der eine neuartige Technik verwendet, um die Genauigkeit und Geschwindigkeit bei der Suche nach nächsten Nachbarn zu verbessern. Er übertrifft bestehende Methoden und hat ein breites Anwendungsspektrum bei Aufgaben des maschinellen Lernens, die eine semantische Suche erfordern. Die Forschungsbemühungen von Google umfassen verschiedene Bereiche, darunter grundlegendes ML und die gesellschaftlichen Auswirkungen von KI.

SOAR: Neue Algorithmen für noch schnellere Vektorsuche mit ScaNN Der SOAR-Algorithmus von Google verbessert die Effizienz der Vektorsuche durch die Einführung kontrollierter Redundanz, wodurch schnellere Suchvorgänge mit kleineren Indexen möglich sind. SOAR weist Vektoren mehreren Clustern zu und erstellt so „Backup“-Suchpfade für eine bessere Leistung.


Erste Schritte mit der Vektorsuche in Vertex AI

Die Vektorsuche ist ein leistungsstarkes Tool zum Erstellen von KI-gestützten Anwendungen. In diesem Video wird die Technologie vorgestellt und eine Schritt-für-Schritt-Anleitung für den Einstieg gegeben.



Hybridsuche mit der Vektorsuche

Die Vektorsuche kann für die Hybridsuche verwendet werden, sodass Sie die Leistungsfähigkeit der Vektorsuche mit der Flexibilität und Geschwindigkeit einer herkömmlichen Suchmaschine kombinieren können. In diesem Video wird die Hybridsuche vorgestellt und gezeigt, wie Sie die Vektorsuche für die Hybridsuche verwenden.



Sie verwenden die Vektorsuche bereits! So werden Sie zum Experten

Wussten Sie, dass Sie die Vektorsuche wahrscheinlich jeden Tag verwenden, ohne es zu merken? Von der Suche nach dem schwer zu findenden Produkt in den sozialen Medien bis hin zur Suche nach einem Song, der Ihnen nicht aus dem Kopf geht – die Vektorsuche ist die KI-Magie hinter diesen alltäglichen Erfahrungen.



Neue Einbettung des Aufgabentyps vom DeepMind-Team verbessert die RAG-Suchqualität

Verbessern Sie die Genauigkeit und Relevanz Ihrer RAG-Systeme mit neuen Aufgabentyp-Einbettungen, die vom Google DeepMind-Team entwickelt wurden. Sehen Sie sich das Video an und erfahren Sie mehr über die häufigsten Herausforderungen bei der RAG-Suchqualität und wie Einbettungen des Aufgabentyps die semantische Lücke zwischen Fragen und Antworten effektiv schließen können, was zu einem effektiveren Abruf und einer verbesserten RAG-Leistung führt.

Terminologie der Vektorsuche

Diese Liste enthält einige wichtige Begriffe, die Sie kennen müssen, um die Vektorsuche zu verwenden:

  • Vektor: Ein Vektor ist eine Liste von Gleitkommawerten mit Größe und Richtung. Sie können damit alle Arten von Daten darstellen, z. B. Zahlen, Punkte im Raum und Richtungen.

  • Einbettung: Eine Einbettung ist ein Vektortyp, der zur Darstellung von Daten verwendet wird, um ihre semantische Bedeutung zu erfassen. Einbettungen werden meist mithilfe von Techniken des maschinellen Lernens erstellt und häufig in Natural Language Processing (NLP) und anderen ML-Anwendungen verwendet.

    • Hohe Einbettungen: Hohe Einbettungen stellen die semantische Bedeutung von Text dar und verwenden Arrays, die hauptsächlich Werte ungleich null enthalten. Mit hohen Einbettungen können ähnliche Suchergebnisse basierend auf der semantischen Ähnlichkeit zurückgegeben werden.

    • Dünnbesetzte Einbettungen: Dünnbesetzte Einbettungen stellen die Textsyntax dar, und verwenden hochdimensionale Arrays, die im Vergleich zu hohen Einbettungen nur sehr wenige Werte ungleich null enthalten. Dünnbesetzte Einbettungen werden häufig für die Keyword-Suche verwendet.

  • Hybridsuche: Bei der Hybridsuche werden sowohl hohe als auch dünnbesetzte Einbettungen verwendet, wodurch Sie basierend auf einer Kombination aus Keyword-Suche und semantischer Suche suchen können. Die Vektorsuche unterstützt die Suche basierend auf hohen Einbettungen, dünnbesetzten Einbettungen und der Hybridsuche.

  • Index: Eine Sammlung von Vektoren, die gemeinsam für die Ähnlichkeitssuche bereitgestellt werden. Vektoren können einem Index hinzugefügt oder aus einem Index entfernt werden. Ähnlichkeitssuchanfragen werden an einen bestimmten Index gestellt und durchsuchen die Vektoren in diesem Index.

  • Ground Truth: Ein Begriff, bei dem das maschinelle Lernen auf Genauigkeit im echten Leben geprüft wird, z. B. ein Ground Truth-Dataset.

  • Recall: Der Prozentsatz der nächsten Nachbarn, die vom Index zurückgegeben werden und tatsächlich die nächsten Nachbarn sind. Wenn z. B. eine Abfrage nach 20 nächsten Nachbarn 19 der „grundlegend echten“ nächsten Nachbarn zurückgibt, beträgt der Recall 19/20x100 = 95%.

  • Einschränken: Funktion, mit der Suchanfragen mithilfe von booleschen Regeln auf eine Teilmenge des Index beschränkt werden können. „Einschränken“ wird auch als „Filter“ bezeichnet. Mit der Vektorsuche können Sie numerische Filterung und Filterung nach Textattributen verwenden.