Vektorsuche 2.0

Vector Search 2.0 ist ein Google Cloud Produkt, das von Grund auf als selbstoptimierende, vollständig verwaltete, KI-native Suchmaschine konzipiert wurde. Die vorhandene Vektorsuche von Google Cloudist ein leistungsstarkes ANN-Index-as-a-Service-System (Approximate Nearest Neighbor). Bei der Vektorsuche 2.0 wird dieses Konzept zu einem umfassenden Speicher- und Abrufsystem weiterentwickelt. Anstatt Indizes als primäre Ressource zu verwalten, arbeiten Sie mit Sammlungen von Datenobjekten.

Die Suchmaschinenarchitektur bietet eine replizierte, skalierbare Speicher-Engine, die Vector Search 2.0 zu einer einzigen, einheitlichen Datenquelle für Ihre KI-Anwendungen macht und zusätzlichen Datenspeicher überflüssig macht.

Zu den wichtigsten Vorteilen dieser neuen Architektur gehören:

  • Entwicklerfreundlich:Mit intuitiven Clientbibliotheken, die nur minimalen Code erfordern, können Sie schnell loslegen. Das System wird automatisch optimiert, um eine hohe Leistung aufrechtzuerhalten. Die zugrunde liegende Infrastruktur wird abstrahiert, sodass Sie keine VMs oder Replikate konfigurieren müssen.

  • Schnelle Einarbeitung und Bewertung:Erstellen Sie Sammlungen, fügen Sie Ihre Daten hinzu und beginnen Sie schnell mit der Suche.

  • Einheitliche Datenspeicherung:Sie können Ihre Dokumente an einem zentralen Ort speichern, abrufen und nach Vektorähnlichkeit und Nutzlastdaten filtern.

  • Leistungsstarke Funktionen:Mit integrierten Modellen lassen sich Einbettungsfelder automatisch ausfüllen. Außerdem können Sie Ihre Daten mit umfangreichen Abfragefunktionen analysieren, eigene Einbettungen verwenden (BYOE) und schnell Indexe erstellen, um die Leistung zu steigern.

  • Vereinfachte Preise:Die anpassungsfähige Preisgestaltung bietet zwei Modelle: nutzungsbasiert für kleinere Arbeitslasten und ressourcenbasiert für optimierte Leistung.

Vector Search 2.0 bietet weiterhin die hohe Leistung und massive Skalierbarkeit von Vector Search 1.0, sodass Sie ganz einfach loslegen und skalieren können.

Konzepte

Bevor Sie beginnen, sollten Sie sich mit den folgenden Konzepten der Vektorsuche 2.0 vertraut machen:

  • Sammlung:Ein Container für eine Reihe von zugehörigen JSON-Objekten. Dies ist mit einer Tabelle in einer relationalen Datenbank vergleichbar. Sie können viele Sammlungen in einer einzelnen Datenbank erstellen.

  • Datenobjekt:Ein einzelnes JSON-Objekt, das in einer Sammlung gespeichert ist.

  • Sammlung: Schema:Definiert die Struktur und Einschränkungen der Datenobjekte in einer Sammlung. Sie kann sowohl für strenge als auch für lockere Schemavalidierungen konfiguriert werden.

  • Sammlungsindex:Ermöglicht die effiziente Suche nach dem ungefähren nächsten Nachbarn (Approximate Nearest Neighbor, ANN) in Datenobjekten innerhalb einer Sammlung. Eine Sammlung kann mehrere Indexe haben, z. B. einen für jedes Vektorfeld in Ihren Datenobjekten.

Nächste Schritte