Vektorsuche 2.0

Vector Search 2.0 ist ein Google Cloud Produkt, das von Grund auf als selbstoptimierende, vollständig verwaltete, KI-native Suchmaschine konzipiert wurde. Die vorhandene Vektorsuche ist ein leistungsstarkes ANN-System (Approximate Nearest Neighbor) für Indexe als Dienst, aber die Vektorsuche 2.0 entwickelt dieses Konzept zu einem umfassenden Speicher- und Abrufsystem weiter. Anstatt Indexe als primäre Ressource zu verwalten, arbeiten Sie mit Sammlungen von Datenobjekten.

Die Suchmaschinenarchitektur bietet eine replizierte, skalierbare Speicher-Engine, sodass Vector Search 2.0 eine einzige, einheitliche Datenquelle für Ihre KI-Anwendungen ist und kein zusätzlicher Datenspeicher erforderlich ist.

Zu den wichtigsten Vorteilen dieser neuen Architektur gehören:

  • Entwicklerfreundlich:Mit intuitiven Clientbibliotheken, die nur minimalen Code erfordern, können Sie schnell loslegen. Das System wird automatisch optimiert, um eine hohe Leistung aufrechtzuerhalten. Die zugrunde liegende Infrastruktur wird abstrahiert, sodass Sie keine VMs oder Replikate konfigurieren müssen.

  • Schnelle Einarbeitung und Bewertung:Erstellen Sie Sammlungen, fügen Sie Ihre Daten hinzu und beginnen Sie schnell mit der Suche.

  • Einheitlicher Datenspeicher: Sie können Ihre Dokumente an einem zentralen Ort speichern, abrufen und nach Vektorähnlichkeit und Nutzlastdaten filtern.

  • Leistungsstarke Funktionen:Mit integrierten Modellen lassen sich Einbettungsfelder automatisch ausfüllen. Außerdem können Sie Ihre Daten mit umfangreichen Abfragefunktionen analysieren, eigene Einbettungen (Bring Your Own Embeddings, BYOE) verwenden und schnell Indexe erstellen, um die Leistung zu steigern.

  • Vereinfachte Preise:Das flexible Preismodell bietet zwei Modelle: nutzungsbasiert für kleinere Arbeitslasten und ressourcenbasiert für optimierte Leistung.

Vector Search 2.0 bietet die hohe Leistung und massive Skalierbarkeit von Vector Search 1.0. So können Sie ganz einfach loslegen und skalieren.

Konzepte

Bevor Sie beginnen, sollten Sie sich mit den folgenden Konzepten von Vector Search 2.0 vertraut machen:

  • Sammlung:Ein Container für eine Reihe von zugehörigen JSON-Objekten. Das ist vergleichbar mit einer Tabelle in einer relationalen Datenbank. Sie können viele Sammlungen in einer einzelnen Datenbank erstellen.

  • Datenobjekt:Ein einzelnes JSON-Objekt, das in einer Sammlung gespeichert ist.

  • Sammlung: Schema:Definiert die Struktur und Einschränkungen der Datenobjekte in einer Sammlung. Sie kann sowohl für strenge als auch für lockere Schemavalidierungen konfiguriert werden.

  • Sammlungsindex:Ermöglicht eine effiziente Suche nach ungefähren nächsten Nachbarn (Approximate Nearest Neighbor, ANN) in Datenobjekten innerhalb einer Sammlung. Eine Sammlung kann mehrere Indexe haben, z. B. einen für jedes Vektorfeld in Ihren Datenobjekten.

Nächste Schritte