Bevor Sie die Vektorsuche verwenden können, müssen Sie ein Einbettungsmodell auswählen, Ihre Daten vorbereiten und entscheiden, welchen Endpunkttyp Sie verwenden möchten. Auf dieser Seite finden Sie einige Informationen dazu.
Einbettungen vorbereiten
Wenn Sie die Vektorsuche verwenden möchten, müssen Ihre Einbettungen bereit sein. Wenn Sie Ihre Einbettungen bereits haben, fahren Sie mit Endpunkt auswählen fort.
So erstellen Sie Ihre Einbettungen:
Einbettungsmodell auswählen: Es gibt viele externe Einbettungsmodelle mit unterschiedlichen Funktionen.
Die Vektorsuche unterstützt dichte Einbettungen, dünnbesetzte Einbettungen und die Hybridsuche. Bei der Hybridsuche werden dichte und dünnbesetzte Einbettungen entsprechend der Gewichtung verwendet, die Sie für diese Einbettungstypen angeben.
Wählen Sie je nach Anwendungsfall einen der folgenden Modelltypen aus:
Sofort einsatzbereit: Wenn Sie Text Texten oder Bildern semantisch allein auf Basis der Relevanz des Texts oder des Bildes zuordnen möchten. Dies ist ein Standardanwendungsfall, daher müssen Sie das Modell nicht trainieren oder optimieren. Texteinbettungen sind eine empfohlene Option für diesen Anwendungsfall. Die Agent Platform verwendet dichte Einbettungsmodelle.
Benutzerdefiniertes Modell für Einbettungen: Wenn Sie einen Abgleich anhand von Ihren eigenen Daten oder eines bestimmten Anwendungsfalls machen möchten.
Daten vorbereiten: Bereinigen und verarbeiten Sie Ihre Daten vor, damit sie in einem Format vorliegen, das vom Einbettungsmodell verwendet werden kann.
Einbettungsmodell bei Verwendung eines benutzerdefinierten Modells trainieren: Wenn Sie sich für die Verwendung eines benutzerdefinierten Einbettungsmodells (Optimierung) entscheiden, müssen Sie es mit Ihren Daten trainieren. Dabei kann es sich um einen zeitaufwendigen Prozess handeln, der von der Größe und Komplexität Ihrer Daten abhängt. Wenn Sie ein vortrainiertes Modell aus dem Model Garden, können Sie diesen Schritt überspringen.
Einbettungen generieren: Nachdem das Modell trainiert wurde, verwenden Sie es, um Einbettungen für Ihre Daten zu generieren.
Endpunkt auswählen
Nachdem Sie Ihren Index erstellt haben, stellen Sie ihn auf einem Endpunkt bereit. Weitere Informationen finden Sie unter Öffentliche Indexendpunkte bereitstellen und verwalten und Indexendpunkte in einem VPC-Netzwerk bereitstellen und verwalten. Es ist hilfreich, vor dem Erstellen des Index zu entscheiden, welche Art von Endpunkt Sie benötigen.
Sie können Ihren Abfrageindex auf einem der folgenden Elemente bereitstellen:
Öffentlicher Endpunkt: Wenn die Bereitstellung auf einem öffentlichen Endpunkt erfolgt, müssen Sie Ihr Netzwerk nicht einrichten. Öffentliche Netzwerke haben eine etwas höhere Latenz, lassen sich aber schneller einrichten und einfacher verwalten.
Privater Endpunkt: Wenn Sie eine VPC verwenden möchten, müssen Sie zuerst das Netzwerk einrichten. Die Vektorsuche unterstützt zwei Arten von privaten Netzwerken.
VPC-Netzwerk-Peering-Verbindung für eine geringere Netzwerklatenz.
Private Service Connect ermöglicht die private Nutzung von Diensten in VPC-Netzwerken, die zu verschiedenen Gruppen, Teams, Projekten oder Organisationen gehören.
Nächste Schritte
Nachdem Sie Ihre Einbettungen generiert und entschieden haben, wo Sie Ihren Index bereitstellen möchten, müssen Sie ihn konfigurieren.
- Weitere Informationen zum Konfigurieren von Format und Struktur der Eingabedaten
- Informationen zum Erstellen eines Vektorsuchindex mit Notebook-Anleitungen
- Weitere Informationen zum Verwalten von Indexen