Die Vektorsuche 2.0 ist ein Google Cloud Produkt, das von Grund auf als selbstoptimierende, vollständig verwaltete, KI-native Suchmaschine konzipiert wurde. Die bestehende Vektorsuche ist ein leistungsstarkes System für den ungefähren nächsten Nachbarn (Approximate Nearest Neighbor, ANN) als Dienst. Die Vektorsuche 2.0 erweitert dieses Konzept zu einem umfassenden Speicher- und Abrufsystem. Google CloudAnstatt Indexe als primäre Ressource zu verwalten, arbeiten Sie mit Sammlungen von Datenobjekten.
Die Architektur der Suchmaschine bietet eine replizierte, skalierbare Speicher-Engine. Dadurch ist die Vektorsuche 2.0 eine einzige, einheitliche Datenquelle für Ihre KI-Anwendungen und es ist kein zusätzlicher Datenspeicher erforderlich.
Zu den wichtigsten Vorteilen gehören:
Entwicklerfreundlich:Mit intuitiven Clientbibliotheken, die nur minimalen Code erfordern, können Sie schnell loslegen. Das System wird automatisch optimiert, um eine hohe Leistung aufrechtzuerhalten. Die zugrunde liegende Infrastruktur wird abstrahiert, sodass Sie keine VMs oder Replikate konfigurieren müssen.
Schnelles Onboarding und schnelle Bewertung:Erstellen Sie Sammlungen, fügen Sie Ihre Daten hinzu und starten Sie schnell die Suche.
Einheitlicher Datenspeicher:Sie können Ihre Dokumente an einem Ort nach Vektorähnlichkeit und Nutzlastdaten speichern, abrufen und filtern.
Leistungsstarke Funktionen:Sie können Einbettungsfelder automatisch mit integrierten Modellen füllen, Ihre Daten mit umfassenden Abfragefunktionen untersuchen, eigene Einbettungen verwenden (Bring Your Own Embeddings, BYOE) und schnell Indexe erstellen, um die Leistung zu skalieren.
Vereinfachte Preise:Die anpassungsfähige Preisgestaltung bietet zwei Modelle: nutzungsbasiert für kleinere Arbeitslasten und ressourcenbasiert für optimierte Leistung.
Die Vektorsuche 2.0 bietet die hohe Leistung und massive Skalierbarkeit der Vektorsuche 1.0. So können Sie nahtlos loslegen und skalieren.
Konzepte
Bevor Sie beginnen, sollten Sie die folgenden Konzepte der Vektorsuche 2.0 kennen:
Sammlung: Ein Container für eine Reihe verwandter JSON-Objekte. Dies ähnelt einer Tabelle in einer relationalen Datenbank. Sie können viele Sammlungen in einer einzelnen Datenbank erstellen.
Datenobjekt: Ein einzelnes JSON-Objekt, das in einer Sammlung gespeichert ist.
Sammlung: Schema Definiert die Struktur und die Einschränkungen der Datenobjekte in einer Sammlung. Es kann sowohl für strenge als auch für lockere Schemavalidierungen konfiguriert werden.
Sammlungsindex:Ermöglicht eine effiziente Suche nach dem ungefähren nächsten Nachbarn (Approximate Nearest Neighbor, ANN) in Datenobjekten innerhalb einer Sammlung. Eine Sammlung kann mehrere Indexe haben, z. B. einen für jedes Vektorfeld in Ihren Datenobjekten.
Unterstützte Regionen
Die folgenden Regionen werden unterstützt:
asia-east1asia-northeast1asia-southeast1europe-north1europe-west2europe-west4us-central1us-east4us-west1
Nächste Schritte
- Interaktive Demo ausprobieren.
- Informationen zum Erstellen einer Sammlung.