Vector Search 2.0 ist ein Google Cloud Produkt, das von Grund auf als selbstoptimierende, vollständig verwaltete, KI-native Suchmaschine konzipiert wurde. Die vorhandene Vektorsuche von Google Cloudist ein leistungsstarkes ANN-Index-as-a-Service-System (Approximate Nearest Neighbor). Mit der Vektorsuche 2.0 wird dieses Konzept zu einem umfassenden Speicher- und Abrufsystem weiterentwickelt. Anstatt Indizes als primäre Ressource zu verwalten, arbeiten Sie mit Sammlungen von Datenobjekten.
Die Suchmaschinenarchitektur bietet eine replizierte, skalierbare Speicher-Engine, die Vector Search 2.0 zu einer einzigen, einheitlichen Datenquelle für Ihre KI-Anwendungen macht und zusätzlichen Datenspeicher überflüssig macht.
Zu den wichtigsten Vorteilen gehören:
Entwicklerfreundlich:Mit intuitiven Clientbibliotheken, die nur minimalen Code erfordern, können Sie schnell loslegen. Das System wird automatisch optimiert, um eine hohe Leistung aufrechtzuerhalten. Die zugrunde liegende Infrastruktur wird abstrahiert, sodass Sie keine VMs oder Replikate konfigurieren müssen.
Schnelle Einarbeitung und Bewertung:Erstellen Sie Sammlungen, fügen Sie Ihre Daten hinzu und beginnen Sie schnell mit der Suche.
Einheitlicher Datenspeicher: Sie können Ihre Dokumente an einem zentralen Ort speichern, abrufen und nach Vektorähnlichkeit und Nutzlastdaten filtern.
Leistungsstarke Funktionen:Bettenfelder automatisch mit integrierten Modellen ausfüllen, Daten mit umfangreichen Abfragefunktionen analysieren, eigene Einbettungen (Bring Your Own Embeddings, BYOE) verwenden und schnell Indexe erstellen, um die Leistung zu steigern.
Vereinfachte Preise:Die anpassungsfähige Preisgestaltung bietet zwei Modelle: nutzungsbasiert für kleinere Arbeitslasten und ressourcenbasiert für optimierte Leistung.
Vector Search 2.0 bietet die hohe Leistung und massive Skalierbarkeit von Vector Search 1.0. So können Sie ganz einfach loslegen und skalieren.
Konzepte
Bevor Sie beginnen, sollten Sie sich mit den folgenden Konzepten der Vektorsuche 2.0 vertraut machen:
Sammlung:Ein Container für eine Reihe von zugehörigen JSON-Objekten. Das ist vergleichbar mit einer Tabelle in einer relationalen Datenbank. Sie können viele Sammlungen in einer einzelnen Datenbank erstellen.
Datenobjekt:Ein einzelnes JSON-Objekt, das in einer Sammlung gespeichert ist.
Sammlung: Schema:Definiert die Struktur und Einschränkungen der Datenobjekte in einer Sammlung. Sie kann sowohl für strenge als auch für lockere Schemavalidierungen konfiguriert werden.
Sammlungsindex:Ermöglicht eine effiziente Suche nach ungefähren nächsten Nachbarn (Approximate Nearest Neighbor, ANN) in Datenobjekten innerhalb einer Sammlung. Eine Sammlung kann mehrere Indexe haben, z. B. einen für jedes Vektorfeld in Ihren Datenobjekten.
Unterstützte Regionen
Die folgenden Regionen werden unterstützt:
europe-west2us-west1asia-east1asia-northeast1asia-southeast1europe-north1europe-west4us-central1us-east4