In dieser interaktiven Demo können Sie die Vektorsuche 2.0 kennenlernen, die vollständig verwaltete Vektordatenbank für Google Cloud. In der Demo können Sie Millionen von Produkteinträgen durchsuchen. Dazu stehen Ihnen die semantische Suche (basierend auf automatischen Gemini-Einbettungen), die Stichwortsuche oder die Hybridsuche zur Verfügung. Bei der Hybridsuche wird Reciprocal Rank Fusion (RRF) verwendet, um die semantische Suche und die Stichwortsuche zu kombinieren. Die Ergebnisse können neu gerankt werden. Dazu wird die Gemini Enterprise Agent Platform Ranking API verwendet.
Vorteile der Vektorsuche 2.0
Für die Vektorsuche waren eine separate Einbettungsgenerierung, die Bereitstellung des Index und ein Vertex AI Feature Store für Metadaten erforderlich. Vector Search 2.0 bietet einheitlichen Speicher für Daten und Einbettungen, die automatische Generierung von Einbettungen und eine integrierte Textsuche, ohne dass Sie die Infrastruktur verwalten müssen.
Testen!
So führen Sie den Befehl aus:
Beschreiben Sie im Feld Abfrage die Elemente, nach denen Sie suchen möchten (z. B.
vintage 1970s pinball machine). Alternativ können Sie auf Abfrage generieren klicken, um eine Beschreibung automatisch generieren zu lassen.Klicken Sie auf Senden oder drücken Sie die Eingabetaste.
Probieren Sie die verschiedenen Optionen in der Demo aus, um sich mit der Vektorsuche 2.0 und den Grundlagen der Vektorsuche vertraut zu machen. Weitere Informationen finden Sie unter Benutzeroberfläche.
Benutzeroberfläche
In diesem Abschnitt werden die Einstellungen in der Benutzeroberfläche beschrieben, mit denen Sie die Ergebnisse steuern können, die von Vector Search 2.0 zurückgegeben werden, und wie sie gerankt werden.
Dataset
Wählen Sie im Drop-down-Menü Dataset das Dataset aus, für das Vector Search 2.0 Ihre Anfrage ausführen soll. Informationen zu den einzelnen Datasets finden Sie unter Datasets.
Abfrage
So führen Sie eine Abfrage aus:
Klicken Sie auf Dataset und wählen Sie das Dataset aus, für das Sie die Abfrage ausführen möchten.
Geben Sie im Feld Abfrage eine Beschreibung ein, stellen Sie eine Frage oder geben Sie ein oder mehrere Keywords ein, um die Elemente anzugeben, für die Vector Search 2.0 Ergebnisse zurückgeben soll. Alternativ können Sie auch auf Abfrage generieren klicken, um eine Abfrage automatisch generieren zu lassen.
Führen Sie einen der folgenden Schritte aus:
- Wenn Sie semantisch ähnliche Ergebnisse zurückgeben möchten, wählen Sie Semantisch aus.
- Wenn Ergebnisse auf Grundlage der Textsyntax der Anfrage zurückgegeben werden sollen, wählen Sie Text aus.
- Für eine hybride Suche wählen Sie sowohl Semantisch als auch Text aus.
Wenn Sie eine semantische Abfrage für das Dataset Mercari 3M items (128-dim Gemini text embeddings) oder Mercari 3M items (768-dim Gemini text embeddings) ausführen, klicken Sie auf Query Task Type (Abfragetyp) und wählen Sie entweder QUESTION_ANSWERING (Frage-Antwort) oder RETRIEVAL_QUERY (Abruf) aus.
Klicken Sie auf Senden oder drücken Sie die Eingabetaste, um die Abfrage auszuführen.
Ändern
Es gibt viele Optionen, mit denen Sie die Ergebnisse ändern können, die von Vector Search 2.0 für eine Anfrage zurückgegeben werden.
Klicken Sie auf Zeilen und wählen Sie die maximale Anzahl von Suchergebnissen aus, die von Vector Search 2.0 zurückgegeben werden sollen.
Wählen Sie Semantisch aus, um semantisch ähnliche Ergebnisse zurückzugeben.
Wählen Sie Text aus, um Ergebnisse basierend auf der Textsyntax Ihrer Anfrage zu erhalten.
Wählen Sie sowohl Semantisch als auch Text aus, um die hybride Suche zu aktivieren.
Wählen Sie Neu einstufen aus, um die Suchergebnisse anhand ihrer Relevanz für die Anfrage neu einzustufen. Weitere Informationen finden Sie unter Such- und RAG-Qualität mit Ranking API verbessern.
Wählen Sie kNN verwenden aus, um den k-Nearest Neighbors-Algorithmus zum Abrufen von Suchergebnissen zu verwenden. Da kNN eine Recall-Rate von 100% bietet, ist es sehr nützlich für das Debugging oder Testen.
Klicken Sie auf Query Task Type (Typ der Abfrageaufgabe) und wählen Sie den gewünschten Typ aus. Diese Option ist nur verfügbar, wenn Sie die Datasets Mercari 3M items (128-dim Gemini text embeddings) und Mercari 3M items (768-dim Gemini text embeddings) verwenden. Weitere Informationen zu Abfrageaufgabentypen finden Sie unter Aufgabentyp für Einbettungen auswählen.
Geben Sie im Feld RRF-Alpha einen Wert zwischen 0,0 und 1,0 ein, um den RRF-Ranking-Effekt festzulegen. Diese Option ist nur für die Hybridsuche verfügbar, bei der sowohl Semantisch als auch Text ausgewählt sind.
Alphawerte von:1.0– Ergebnisse werden nur nach semantischer (dichter) Ähnlichkeit sortiert.0.0: Ergebnisse werden nur nach Keyword-Relevanz (spärlich) sortiert.0.5– Die Ergebnisse werden mit gleichem Gewicht für semantische (dichte) Ähnlichkeit und Keyword-Relevanz (dünnbesetzt) eingestuft.
Weitere Informationen finden Sie unter Was ist Reciprocal Rank Fusion?
Messwerte
Nachdem eine Anfrage ausgeführt wurde, erhalten Sie Latenzmesswerte, die die Zeit aufschlüsseln, die für die verschiedenen Phasen der Suche benötigt wurde.
Dazu zählen:
- Die Gesamtlatenz aus allen Quellen.
- Die Zeit, die zum Generieren von Einbettungen und zum Ausführen einer Vektorsuche benötigt wurde.
- Die Zeit, die für das Neuklassifizieren benötigt wurde, wenn Rerank ausgewählt ist.
- Die Gesamtlatenz des Netzwerks und anderer Quellen.
Einbettungen
Vector Search 2.0 unterstützt die folgenden Einbettungstypen:
Multimodal:Multimodale semantische Suche nach Artikelbildern. Weitere Informationen finden Sie unter What is Multimodal Search: 'LLMs with vision' change businesses.
Text (semantische Ähnlichkeit): Semantische Textsuche in Artikelnamen und ‑beschreibungen basierend auf semantischer Ähnlichkeit. Weitere Informationen finden Sie unter Vertex AI Embeddings for Text: LLMs fundieren leicht gemacht.
Text (Abrufdokument): Asymmetrische Suche basierend auf einer Frage oder einem kurzen Ausdruck. Weitere Informationen finden Sie unter Vertex AI Embeddings for Text: LLMs einfach fundieren.
Word:Semantisches Verständnis auf Wortebene mit sehr schnellen Inferenzzeiten und hoher Kompaktheit.
Abfrageprozess
Bei Vector Search 2.0 hängt der Abfrageprozess von der Art der durchgeführten Suchen und den Einbettungsmodellen ab.
Semantische und hybride Suche
Die Generierung und Suche von Einbettungen erfolgt in einem einzigen API-Aufruf.
Bei Vector Search 2.0 wird die Anfrageeinbettung serverseitig automatisch mit dem im vertex_embedding_config für die Collection angegebenen Modell generiert. Die Suche wird ausgeführt und es werden Ergebnisse mit vollständigen Metadaten zurückgegeben, ohne dass ein separater Vertex AI Feature Store-Abruf erforderlich ist.
Word2Vec und multimodal
Der Client generiert die Abfrageeinbettung und sendet sie zur Vektorsuche an Vector Search 2.0. Die Ergebnisse enthalten weiterhin vollständige Metadaten aus der Sammlung und ein Vertex AI Feature Store-Abruf ist nicht erforderlich.
Text
Bei Vector Search 2.0 wird der Abgleich von Suchbegriffen direkt ausgeführt. Es werden keine Einbettungen generiert.
Datasets
| Dataset | Beschreibung | Einbettungsmodell | Aufgabentyp für Einbettungen |
|---|---|---|---|
| Mercari 1M items (768-dim Gemini text embeddings) |
Verwendet das Einbettungsmodell „Gemini Embedding 2“ mit separaten Text- und Bildeinbettungen. Dieser Datensatz unterstützt die Text-zu-Text- und Text-zu-Bild-Suche mit verschiedenen Vektorfeldern. | gemini-embedding-2-preview
|
SEMANTIC_SIMILARITY |
| Mercari 3M-Artikel (128-dimensionale Gemini-Texteinbettungen) |
Die Anzahl der Einbettungsdimensionen ist geringer, was zu einer kleineren Indexgröße und geringeren Speicherkosten führt. Die Genauigkeit dieses Datasets ist möglicherweise geringer als die von Mercari 3M-Artikeln (768-dimensionale Gemini-Texteinbettungen). | gemini-embedding-001
|
RETRIEVAL_DOCUMENT |
| Mercari 3M-Artikel (768-dimensionale Gemini-Texteinbettungen) |
Verfügt über Einbettungen mit voller Dimension mit automatischen Einbettungen und hoher semantischer Genauigkeit des Texts. In diesem Dataset wird RETRIEVAL_DOCUMENT für den asymmetrischen Abfrage-Dokument-Abgleich verwendet. | gemini-embedding-001
|
RETRIEVAL_DOCUMENT |
| 3 Millionen Artikel von Mercari (768-dimensionale Gemini-Texteinbettungen, semantische Ähnlichkeit) |
Verwendet den Aufgabentyp SEMANTIC_SIMILARITY für den Ähnlichkeitsabgleich. Dieses Dataset eignet sich am besten für Anwendungsfälle, in denen die Funktion „Ähnliche Elemente finden“ benötigt wird und Abfrage und Dokumente dieselbe Semantik haben. | gemini-embedding-001
|
SEMANTIC_SIMILARITY |
| Mercari 3M-Artikel (1.408-dimensionale multimodale Vertex AI-Einbettungen) |
Verwendet multimodale Vertex AI-Einbettungen, die Artikelbilder für die Bildersuche codieren. | multimodal-embedding-001
|
– |
| Mercari 3M-Artikel (100-dimensionale Word2Vec-Texteinbettungen) |
Verwendet das Gensim Word2Vec-Einbettungsmodell. Dieses Dataset ermöglicht die schnellste Inferenz. Es bietet nur ein semantisches Verständnis auf Wortebene, ist aber sehr kompakt. | Gensim Word2Vec | – |