Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Agent Retrieval (früher Vektorsuche 2.0)

Agent Retrieval (früher Vector Search 2.0) ist ein Google Cloud Produkt, das von Grund auf als selbstoptimierende, vollständig verwaltete, KI-native Suchmaschine konzipiert wurde. Die vorhandene Vektorsuche von Google Cloudist ein leistungsstarkes ANN-System (Approximate Nearest Neighbor) für Index-as-a-Service. Agent Retrieval entwickelt dieses Konzept zu einem umfassenden Speicher- und Abrufsystem weiter. Anstatt Indexe als primäre Ressource zu verwalten, arbeiten Sie mit Sammlungen von Datenobjekten.

Die Suchmaschinenarchitektur bietet eine replizierte, skalierbare Speicher-Engine, wodurch Agent Retrieval zu einer einzigen, einheitlichen Datenquelle für Ihre KI-Anwendungen wird und kein zusätzlicher Datenspeicher erforderlich ist.

Zu den wichtigsten Vorteilen gehören:

Entwicklerfreundlich:Mit intuitiven Clientbibliotheken, die nur minimalen Code erfordern, können Sie schnell loslegen. Das System wird automatisch optimiert, um eine hohe Leistung zu erzielen. Die zugrunde liegende Infrastruktur wird abstrahiert, sodass Sie keine VMs oder Replikate konfigurieren müssen.
Schnelle Einarbeitung und Bewertung:Erstellen Sie Sammlungen, fügen Sie Ihre Daten hinzu und beginnen Sie schnell mit der Suche.
Einheitlicher Datenspeicher: Sie können Ihre Dokumente an einem Ort speichern, abrufen und nach Vektorähnlichkeit und Nutzlastdaten filtern.
Leistungsstarke Funktionen:Bettenfelder mit integrierten Modellen automatisch ausfüllen, Daten mit umfangreichen Abfragefunktionen analysieren, eigene Einbettungen (Bring Your Own Embeddings, BYOE) verwenden und schnell Indexe erstellen, um die Leistung zu steigern.
Vereinfachte Preise:Das flexible Preismodell bietet zwei Modelle: nutzungsbasiert für kleinere Arbeitslasten und ressourcenbasiert für optimierte Leistung. Informationen zum Schätzen der Kosten für Ihren Anwendungsfall finden Sie unter Kostenschätzung.

Agent Retrieval bietet die hohe Leistung und massive Skalierbarkeit von Vector Search 1.0, sodass der Einstieg und die Skalierung nahtlos möglich sind.

Konzepte

Bevor Sie beginnen, sollten Sie sich mit den folgenden Konzepten für das Abrufen von Agenten vertraut machen:

Sammlung:Ein Container für eine Reihe von zugehörigen JSON-Objekten. Dies ist mit einer Tabelle in einer relationalen Datenbank vergleichbar. Sie können viele Sammlungen in einer einzelnen Datenbank erstellen.
Datenobjekt:Ein einzelnes JSON-Objekt, das in einer Sammlung gespeichert ist.
Sammlung: Schema:Definiert die Struktur und Einschränkungen der Datenobjekte in einer Sammlung. Sie kann sowohl für strenge als auch für lockere Schemavalidierungen konfiguriert werden.
Sammlungsindex:Ermöglicht eine effiziente Suche nach ungefähren nächsten Nachbarn (Approximate Nearest Neighbor, ANN) in Data Objects innerhalb einer Sammlung. Eine Sammlung kann mehrere Indexe haben, z. B. einen für jedes Vektorfeld in Ihren Datenobjekten.

Preisschätzung

Agent Retrieval-Preise und Preisrechner: Die Preise für Agent Retrieval umfassen die Kosten für virtuelle Maschinen, die zum Hosten bereitgestellter Indexe verwendet werden, sowie die Kosten für das Erstellen und Aktualisieren von Indexen. Selbst bei einer minimalen Einrichtung (unter 100 $ pro Monat) kann ein hoher Durchsatz für Anwendungsfälle mit mittlerer Größe erreicht werden. So schätzen Sie Ihre monatlichen Kosten:

Rufen Sie den Preisrechner für das Abrufen von Agenten über die Agent Platform auf.
Aktualisiere die Einstellungen auf:
- Beschreiben Sie Ihre Sammlung.
- Wählen Sie eine Suchmethode aus: KNN oder ANN
- Bereitstellung (nur für die ANN-Suchmethode verfügbar)
- Monatliche Zugriffe
- Datenaufnahme
Die Kostenschätzung wird im Bereich Kostendetails aktualisiert.

Unterstützte Regionen

Die folgenden Regionen werden unterstützt:

asia-east1
asia-northeast1
asia-southeast1
europe-north1
europe-west2
europe-west4
us-central1
us-east4
us-west1