Vektorsuche

Die Vektorsuche ist eine leistungsstarke Vektorsuchmaschine, die auf bahnbrechender Technologie von Google Research basiert. Mit dem ScaNN-Algorithmus können Sie mit Vector Search Such- und Empfehlungssysteme der nächsten Generation sowie generative KI-Anwendungen erstellen.

Sie können von derselben Forschung und Technologie profitieren, die auch für die wichtigsten Google-Produkte wie die Google Suche, YouTube und Google Play verwendet werden. Sie profitieren also von der Skalierbarkeit, Verfügbarkeit und Leistung, die für die Verarbeitung riesiger Datasets und die Bereitstellung blitzschneller Ergebnisse weltweit erforderlich sind. Mit der Vektorsuche haben Sie eine Lösung auf Unternehmensniveau, mit der Sie modernste semantische Suchfunktionen in Ihren eigenen Anwendungen implementieren können.

Blog: Multimodale Suche mit der Vektorsuche	Nächste 24 Infinite Nature-Demo
Infinite Fleurs: KI-gestützte Kreativität in voller Blüte	Multimodale KI mit dem Manga ONE PIECE

Jetzt starten

Interaktive Demo zur Vektorsuche: In der Live-Demo sehen Sie ein realistisches Beispiel dafür, was mit der Vektorsuche möglich ist.

Kurzanleitung zur Vektorsuche: Testen Sie die Vektorsuche in 30 Minuten, indem Sie einen Vektorsuchindex mit einem Beispieldataset erstellen, bereitstellen und abfragen. In diesem Tutorial werden Einrichtung, Datenvorbereitung, Indexerstellung, Bereitstellung, Abfrage und Bereinigung behandelt.

Vorbereitung: Bereiten Sie Ihre Einbettungen vor, indem Sie ein Modell auswählen und trainieren und Ihre Daten vorbereiten. Wählen Sie dann einen öffentlichen oder privaten Endpunkt aus, auf dem Sie Ihren Abfrageindex bereitstellen möchten.

Preise für die Vektorsuche und Preisrechner: Die Preise für die Vektorsuche umfassen die Kosten für virtuelle Maschinen, die zum Hosten bereitgestellter Indexe verwendet werden, sowie die Kosten für das Erstellen und Aktualisieren von Indexen. Selbst eine minimale Einrichtung (unter 100 $pro Monat) kann einen hohen Durchsatz für mittelgroße Anwendungsfälle ermöglichen. So schätzen Sie Ihre monatlichen Kosten:

Rufen Sie den Preisrechner von Google Cloud auf.
Klicken Sie auf Der Schätzung hinzufügen.
Suchen Sie nach „Vertex AI“.
Klicken Sie auf die Schaltfläche Vertex AI.
Wählen Sie im Drop-down-Menü Servicetyp die Option Vertex AI Vector Search aus.
Behalten Sie die Standardeinstellungen bei oder konfigurieren Sie Ihre eigenen. Die geschätzten Kosten pro Monat werden im Bereich Kostendetails angezeigt.

Dokumentation

Anwendungsfälle und Blogs

Die Vektorsuche wird zu einem zentralen Knotenpunkt für Unternehmen, die KI einsetzen. Ähnlich wie relationale Datenbanken in IT-Systemen werden verschiedene Geschäftselemente wie Dokumente, Inhalte, Produkte, Nutzer, Ereignisse und andere Einheiten auf Grundlage ihrer Relevanz miteinander verknüpft. Die Vektorsuche kann nicht nur in herkömmlichen Medien wie Dokumenten und Bildern suchen, sondern auch intelligente Empfehlungen liefern, Geschäftsprobleme mit Lösungen abgleichen und sogar IoT-Signale mit Überwachungsbenachrichtigungen verknüpfen. Es ist ein vielseitiges Tool, das für die Nutzung der wachsenden Menge an KI-basierten Unternehmensdaten unerlässlich ist.

Suche / Informationsabruf

Empfehlungssysteme

Wie die Vektorsuche in Vertex AI zur Entwicklung leistungsstarker GenAI-Apps beiträgt:Die Vektorsuche unterstützt verschiedene Anwendungen, darunter E-Commerce, RAG-Systeme und Empfehlungsmaschinen sowie Chatbots und multimodale Suche. Die Hybridsuche verbessert die Ergebnisse für Nischenthemen zusätzlich. Kunden wie Bloomreach, eBay und Mercado Libre nutzen Vertex AI aufgrund der Leistung, Skalierbarkeit und Kosteneffizienz und profitieren von Vorteilen wie schnelleren Suchvorgängen und mehr Conversions.

eBay uses Vector Search for recommendations:Hier wird beschrieben, wie eBay die Vektorsuche für sein Empfehlungssystem nutzt. Mit dieser Technologie kann eBay ähnliche Produkte in seinem umfangreichen Katalog finden und so die Nutzerfreundlichkeit verbessern.

Mercari nutzt die Vektorsuchtechnologie von Google, um einen neuen Marktplatz zu schaffen: Hier wird beschrieben, wie Mercari die Vektorsuche nutzt, um die neue Marktplatzplattform zu verbessern. Die Vektorsuche unterstützt die Empfehlungen der Plattform und hilft Nutzern, relevante Produkte effektiver zu finden.

Vertex AI Embeddings for Text: LLMs fundieren leicht gemacht:Konzentriert sich auf die Fundierung von LLMs mit Vertex AI Embeddings für Textdaten. Die Vektorsuche spielt eine wichtige Rolle beim Auffinden relevanter Textpassagen, die dafür sorgen, dass die Antworten des Modells auf Fakten beruhen.

What is Multimodal Search: "LLMs with vision" change businesses:In diesem Blogbeitrag wird die multimodale Suche beschrieben, bei der LLMs mit visueller Wahrnehmung kombiniert werden. Darin wird erläutert, wie Vector Search sowohl Text- als auch Bilddaten verarbeitet und vergleicht, um umfassendere Suchergebnisse zu ermöglichen.

Multimodale Suche im großen Maßstab ermöglichen: Text- und Bildfunktionen mit Vertex AI kombinieren:Hier wird beschrieben, wie Sie mit Vertex AI eine multimodale Suchmaschine erstellen, die Text- und Bildsuche mit einer gewichteten Ensemble-Methode für den Rank-Biased Reciprocal Rank kombiniert. Dadurch wird die Nutzerfreundlichkeit verbessert und es werden relevantere Ergebnisse bereitgestellt.

Deep Retrieval mit TensorFlow Recommenders und der Vektorsuche skalieren:Hier wird beschrieben, wie Sie mit TensorFlow Recommenders und der Vektorsuche ein Empfehlungssystem für Playlists erstellen. Dabei werden Deep-Retrieval-Modelle, Training, Bereitstellung und Skalierung behandelt.

Generative KI: Abruf für RAG und Agents

Vertex AI und Denodo erschließen Unternehmensdaten mit generativer KI: Hier wird gezeigt, wie Unternehmen durch die Integration von Vertex AI in Denodo generative KI nutzen können, um Erkenntnisse aus ihren Daten zu gewinnen. Die Vektorsuche ist entscheidend für den effizienten Zugriff auf relevante Daten und deren Analyse in einer Unternehmensumgebung.

Infinite Nature und die Natur von Branchen: Diese „wilde“ Demo zeigt die vielfältigen Möglichkeiten von KI: Eine Demo, die das Potenzial von KI in verschiedenen Branchen veranschaulicht. Sie nutzt die Vektorsuche für generative Empfehlungen und die multimodale semantische Suche.

Infinite Fleurs: KI-gestützte Kreativität in voller Blüte:Google hat mit Infinite Fleurs ein KI-Experiment gestartet, bei dem mithilfe von Vector Search, Gemini und Imagen einzigartige Blumensträuße auf Grundlage von Nutzerprompts generiert werden. Diese Technologie zeigt das Potenzial von KI, Kreativität in verschiedenen Branchen zu fördern.

LlamaIndex für RAG in Google Cloud:Beschreibt, wie Sie LlamaIndex verwenden, um die Retrieval-Augmented Generation (RAG) mit großen Sprachmodellen zu ermöglichen. LlamaIndex nutzt Vector Search, um relevante Informationen aus einer Wissensdatenbank abzurufen. So werden genauere und kontextbezogene Antworten generiert.

RAG und Fundierung in Vertex AI:Hier werden RAG- und Fundierungstechniken in Vertex AI untersucht. Die Vektorsuche trägt dazu bei, beim Abrufen relevante Fundierungsinformationen zu identifizieren. So werden generierte Inhalte genauer und zuverlässiger.

Vektorsuche in LangChain:Hier finden Sie eine Anleitung zur Verwendung der Vektorsuche mit LangChain zum Erstellen und Bereitstellen eines Vektordatenbankindex für Textdaten, einschließlich Frage-Antwort- und PDF-Verarbeitung.

BI, Datenanalyse, Monitoring und mehr

KI in Echtzeit dank Streamingaufnahme in Vertex AI:Hier wird die Streamingaktualisierung in der Vektorsuche und die damit verbundenen KI-Funktionen in Echtzeit erläutert. Diese Technologie ermöglicht die Verarbeitung und Analyse eingehender Datenstreams in Echtzeit.

Die folgenden Ressourcen können Ihnen beim Einstieg in die Vektorsuche helfen:

Notebooks und Lösungen
Anleitungen und Schulungen
Ähnliche Produkte
Ausführliche Informationen

Notebooks und Lösungen


Schnellstart für die Vektorsuche in Vertex AI:Bietet einen Überblick über die Vektorsuche. Sie richtet sich an Nutzer, die neu auf der Plattform sind und schnell loslegen möchten.	Erste Schritte mit Texteinbettungen und Vektorsuche:Hier werden Texteinbettungen und die Vektorsuche vorgestellt. Darin wird erläutert, wie diese Technologien funktionieren und wie sie zur Verbesserung der Suchergebnisse eingesetzt werden können.

Semantic Search and Keyword Search: A Hybrid Search Tutorial with Vertex AI Vector Search:Hier finden Sie eine Anleitung zur Verwendung der Vektorsuche für die Hybridsuche. Darin werden die Schritte zum Einrichten und Konfigurieren eines hybriden Suchsystems beschrieben.	Vertex AI RAG Engine mit Vektorsuche:Hier wird die Verwendung der Vertex AI RAG Engine mit der Vektorsuche erläutert. Darin werden die Vorteile der gemeinsamen Verwendung dieser beiden Technologien erläutert und Beispiele für ihre Verwendung in realen Anwendungen gegeben.

Infrastruktur für eine RAG-fähige generative KI-Anwendung mit Vertex AI und Vector Search:Hier wird die Architektur für die Entwicklung einer generativen KI-Anwendung und RAG mit Vector Search, Cloud Run und Cloud Storage beschrieben. Es werden Anwendungsfälle, Designentscheidungen und wichtige Überlegungen behandelt.	Two-Tower-Retrieval für die Kandidatengenerierung im großen Maßstab implementieren:Bietet eine Referenzarchitektur, die zeigt, wie Sie einen End-to-End-Two-Tower-Workflow für die Kandidatengenerierung mit Vertex AI implementieren. Das Two-Tower-Modellierungsframework ist eine leistungsstarke Abruftechnik für Personalisierungsanwendungsfälle, da es die semantische Ähnlichkeit zwischen zwei verschiedenen Einheiten wie Webanfragen und infrage kommenden Elementen lernt.

Training

Erste Schritte mit der Vektorsuche und Einbettungen Mit der Vektorsuche lassen sich ähnliche oder verwandte Elemente finden. Es kann für Empfehlungen, die Suche, Chatbots und die Textklassifizierung verwendet werden. Dazu müssen Sie Einbettungen erstellen, sie in Google Cloudhochladen und sie für die Abfrage indexieren. In diesem Lab geht es um Texteinbettungen mit Vertex AI. Einbettungen können aber auch für andere Datentypen generiert werden.

Vektorsuche und Einbettungen In diesem Kurs wird die Vektorsuche vorgestellt und beschrieben, wie sie beim Erstellen einer Suchanwendung mit Large Language Model-APIs (LLM) für Einbettungen genutzt werden kann. Der Kurs besteht aus konzeptionellen Lektionen über Vektorsuche und Texteinbettungen, interaktiven Demos zum Erstellen einer Vektorsuche in Vertex AI und einem praxisorientierten Lab.

Texteinbettungen verstehen und anwenden Die Vertex AI Embeddings API generiert Texteinbettungen, die
numerische Darstellungen von Text sind, die für Aufgaben wie das Identifizieren ähnlicher Elemente verwendet werden.

In diesem Kurs verwenden Sie Texteinbettungen für Aufgaben wie Klassifizierung und semantische Suche. Außerdem kombinieren Sie die semantische Suche mit LLMs, um mit Vertex AI Question-Answering-Systeme zu erstellen.

Crashkurs „Maschinelles Lernen“: Einbettungen In diesem Kurs werden Worteinbettungen vorgestellt und mit dünnbesetzten Darstellungen verglichen. Es werden Methoden zum Abrufen von Einbettungen untersucht und zwischen statischen und kontextbezogenen Einbettungen unterschieden.

Vertex AI Embeddings Übersicht über die Embeddings API. Anwendungsfälle für Text- und multimodale Einbettungen sowie Links zu zusätzlichen Ressourcen und zugehörigen Google Cloud Diensten.

Vertex AI Search Ranking API Mit der Ranking API werden Dokumente anhand ihrer Relevanz für eine Anfrage neu eingestuft. Dazu wird ein vorab trainiertes Sprachmodell verwendet, das präzise Werte liefert. Sie ist ideal, um Suchergebnisse aus verschiedenen Quellen, einschließlich der Vektorsuche, zu verbessern.

Vertex AI Feature Store Ermöglicht es Ihnen, Feature-Daten mit BigQuery als Datenquelle zu verwalten und bereitzustellen. Er stellt Ressourcen für die Onlinebereitstellung bereit und fungiert als Metadatenebene, um die neuesten Featurewerte direkt aus BigQuery bereitzustellen. Feature Store ermöglicht den sofortigen Abruf von Featurewerten für die Elemente, die Vector Store für Anfragen zurückgegeben hat.

Vertex AI Pipelines Mit Vertex AI Pipelines können Sie Ihre ML-Systeme serverlos automatisieren, überwachen und steuern, indem Sie ML-Workflows mit ML-Pipelines orchestrieren. Sie können ML-Pipelines, die mit Kubeflow Pipelines oder dem TensorFlow Extended (TFX)-Framework definiert wurden, in Batches ausführen. Mit Pipelines können Sie automatisierte Pipelines erstellen, um Einbettungen zu generieren, Vector Search-Indexe zu erstellen und zu aktualisieren und eine MLOps-Einrichtung für Produktionssuch- und Empfehlungssysteme zu erstellen.

Ressourcen mit detaillierten Informationen

Enhancing Your Gen AI Use Case with Vertex AI Embeddings and Task Types Hier geht es darum, generative KI-Anwendungen mit Vertex AI Embeddings und Aufgabentypen zu verbessern. Die Vektorsuche kann mit Einbettungen vom Typ „Aufgabe“ verwendet werden, um den Kontext und die Genauigkeit der generierten Inhalte zu verbessern, indem relevantere Informationen gefunden werden.

TensorFlow Recommenders Eine Open-Source-Bibliothek zum Erstellen von Empfehlungssystemen. Es vereinfacht den Prozess von der Datenaufbereitung bis zur Bereitstellung und unterstützt die flexible Modellerstellung. TFRS bietet Tutorials und Ressourcen und ermöglicht die Erstellung anspruchsvoller Empfehlungsmodelle.

TensorFlow Ranking TensorFlow Ranking ist eine Open-Source-Bibliothek zum Erstellen skalierbarer neuronaler LTR-Modelle (Learning-to-Rank). Es unterstützt verschiedene Verlustfunktionen und Ranking-Messwerte und kann in den Bereichen Suche, Empfehlungen und anderen Feldern eingesetzt werden. Die Bibliothek wird aktiv von Google AI entwickelt.

Announcing ScaNN: Efficient Vector Similarity Search ScaNN von Google, ein Algorithmus für die effiziente Suche nach Vektorähnlichkeiten, nutzt eine neuartige Technik, um die Genauigkeit und Geschwindigkeit beim Finden der nächsten Nachbarn zu verbessern. Es übertrifft bestehende Methoden und kann in vielen Bereichen des maschinellen Lernens eingesetzt werden, in denen eine semantische Suche erforderlich ist. Die Forschungsbemühungen von Google erstrecken sich auf verschiedene Bereiche, darunter grundlegende ML und die gesellschaftlichen Auswirkungen von KI.

SOAR: Neue Algorithmen für noch schnellere Vektorsuche mit ScaNN Der SOAR-Algorithmus von Google verbessert die Effizienz der Vektorsuche durch kontrollierte Redundanz und ermöglicht so schnellere Suchen mit kleineren Indexen. Bei SOAR werden Vektoren mehreren Clustern zugewiesen. So werden „Backup“-Suchpfade für eine bessere Leistung erstellt.

Erste Schritte mit der Vektorsuche in Vertex AI

Die Vektorsuche ist ein leistungsstarkes Tool zum Erstellen von KI-basierten Anwendungen. In diesem Video wird die Technologie vorgestellt und eine Schritt-für-Schritt-Anleitung für den Einstieg gegeben.

Hybridsuche mit der Vektorsuche

Die Vektorsuche kann für die Hybridsuche verwendet werden. So können Sie die Leistungsfähigkeit der Vektorsuche mit der Flexibilität und Geschwindigkeit einer herkömmlichen Suchmaschine kombinieren. In diesem Video wird die Hybridsuche vorgestellt und gezeigt, wie Sie die Vektorsuche für die Hybridsuche verwenden.

Sie verwenden die Vektorsuche bereits!

Wussten Sie, dass Sie die Vektorsuche wahrscheinlich jeden Tag nutzen, ohne es zu merken? Ob Sie nun ein schwer zu findendes Produkt in den sozialen Medien suchen oder ein Lied finden möchten, das Ihnen nicht aus dem Kopf geht – die Vektorsuche ist die KI-Magie hinter diesen alltäglichen Situationen.

Neues „Aufgabentyp“-Embedding vom DeepMind-Team verbessert die RAG-Suchqualität

Mit den neuen Aufgabentyp-Einbettungen, die vom Google DeepMind-Team entwickelt wurden, können Sie die Genauigkeit und Relevanz Ihrer RAG-Systeme verbessern. In diesem Video erfahren Sie mehr über die häufigsten Herausforderungen bei der RAG-Suchqualität und wie Einbettungen für Aufgabentypen die semantische Lücke zwischen Fragen und Antworten effektiv schließen können, was zu einem effektiveren Abruf und einer verbesserten RAG-Leistung führt.

Terminologie der Vektorsuche

Diese Liste enthält einige wichtige Begriffe, die Sie kennen müssen, um die Vektorsuche zu verwenden:

Vektor: Ein Vektor ist eine Liste von Gleitkommawerten mit Betrag und Richtung. Sie können damit alle Arten von Daten darstellen, z. B. Zahlen, Punkte im Raum und Richtungen.
Einbettung: Eine Einbettung ist ein Vektortyp, der zur Darstellung von Daten verwendet wird, um ihre semantische Bedeutung zu erfassen. Einbettungen werden meist mithilfe von Techniken des maschinellen Lernens erstellt und häufig in Natural Language Processing (NLP) und anderen ML-Anwendungen verwendet.
- Hohe Einbettungen: Hohe Einbettungen stellen die semantische Bedeutung von Text mithilfe von Arrays dar, die hauptsächlich Werte ungleich null enthalten. Mit dichten Einbettungen können ähnliche Suchergebnisse auf Grundlage der semantischen Ähnlichkeit zurückgegeben werden.
- Dünnbesetzte Einbettungen: Dünnbesetzte Einbettungen stellen die Textsyntax mithilfe von hochdimensionalen Arrays dar, die im Vergleich zu dichten Einbettungen nur sehr wenige Werte ungleich null enthalten. Sparse Embeddings werden häufig für die Suche nach Keywords verwendet.
Hybridsuche: Bei der Hybridsuche werden sowohl dichte als auch dünnbesetzte Einbettungen verwendet. So können Sie eine Kombination aus Stichwortsuche und semantischer Suche nutzen. Die Vektorsuche unterstützt die Suche auf der Grundlage von dichten Einbettungen, dünnbesetzten Einbettungen und die Hybridsuche.
Index: Eine Sammlung von Vektoren, die gemeinsam für die Ähnlichkeitssuche bereitgestellt werden. Vektoren können einem Index hinzugefügt oder aus einem Index entfernt werden. Ähnlichkeitssuchanfragen werden an einen bestimmten Index gestellt und durchsuchen die Vektoren in diesem Index.
Ground Truth: Ein Begriff, bei dem das maschinelle Lernen auf Genauigkeit im echten Leben geprüft wird, z. B. ein Ground Truth-Dataset.
Recall: Der Prozentsatz der vom Index zurückgegebenen nächsten Nachbarn, die tatsächlich die nächsten Nachbarn sind. Wenn z. B. eine Abfrage nach 20 nächsten Nachbarn 19 der „grundlegend echten“ nächsten Nachbarn zurückgibt, beträgt der Recall 19/20x100 = 95 %.
Einschränken: Funktion, mit der Suchanfragen mithilfe von booleschen Regeln auf eine Teilmenge des Index beschränkt werden. „Einschränken“ wird auch als „Filter“ bezeichnet. Mit der Vektorsuche können Sie numerische Filter und Filter für Textattribute verwenden.

Vektorsuche Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Jetzt starten

Dokumentation

Indexe und Endpunkte verwalten

Themen für Fortgeschrittene

APIs

Weitere Ressourcen

Anwendungsfälle und Blogs

Weitere Informationen

Notebooks und Lösungen

Training

Ähnliche Produkte

Ressourcen mit detaillierten Informationen

Ähnliche Videos

Terminologie der Vektorsuche

Vektorsuche