Datenspeicher werden von Datenspeicher-Tools verwendet, um anhand Ihrer Daten Antworten auf Fragen von Endnutzern zu finden. Datenspeicher sind Sammlungen von Websites, Dokumenten oder Daten in Drittanbietersystemen, die jeweils auf Ihre Daten verweisen.
Wenn ein Endnutzer dem Agenten eine Frage stellt, sucht der Agent in den angegebenen Quellinhalten nach einer Antwort und fasst die Ergebnisse in einer zusammenhängenden Antwort zusammen. Außerdem werden unterstützende Links zu den Quellen der Antwort bereitgestellt, damit der Endnutzer mehr erfahren kann. Der Agent kann bis zu fünf Antwort-Snippets für eine bestimmte Frage liefern.
Datenspeicherquellen
Sie können verschiedene Quellen für Ihre Daten verwenden:
- Website-URLs:Websiteinhalte werden automatisch aus einer Liste von Domains oder Webseiten gecrawlt.
- BigQuery:Daten aus Ihrer BigQuery-Tabelle importieren.
- Cloud Storage:Daten aus Ihrem Cloud Storage-Bucket importieren.
- AlloyDB:Importieren Sie Daten aus Ihrem AlloyDB for PostgreSQL-Cluster.
- Bigtable:Daten werden aus einer Bigtable-Tabelle importiert.
- Firestore:Importieren Sie Daten aus Ihrer Firestore-Sammlung.
- Cloud SQL:Daten aus einer Cloud SQL-Tabelle importieren
- Spanner:Daten aus einer Spanner-Tabelle importieren.
Datenquellen mit eingeschränktem Zugriff
Google bietet viele zusätzliche selbst erhobene und Drittanbieter-Datenspeicherquellen als Funktion mit eingeschränktem Zugriff an. Hier finden Sie eine Liste der verfügbaren Quellen und können Zugriff beantragen.
Websiteinhalte
Wenn Sie Websiteinhalte als Quelle hinzufügen, können Sie mehrere Websites hinzufügen und ausschließen.
Wenn Sie eine Website angeben, können Sie einzelne Seiten oder * als Platzhalter für ein Muster verwenden. Alle HTML- und PDF-Inhalte werden verarbeitet.
Wenn Sie Websiteinhalte als Quelle verwenden, müssen Sie Ihre Domain bestätigen.
Einschränkungen:
- Dateien aus öffentlichen URLs müssen vom Google-Suchindexer gecrawlt worden sein, damit sie im Suchindex erscheinen. Sie können dies mit der Google Search Console prüfen.
- Es werden bis zu 200.000 Seiten indexiert. Wenn der Datenspeicher mehr Seiten enthält, schlägt die Indexierung an diesem Punkt fehl. Bereits indexierte Inhalte bleiben jedoch erhalten.
Daten importieren
Sie können Daten aus BigQuery oder Cloud Storage importieren. Diese Daten können in Form von FAQs oder unstrukturiert sein und mit Metadaten oder ohne Metadaten vorliegen.
Die folgenden Optionen für den Datenimport sind verfügbar:
- Daten hinzufügen/aktualisieren:Fügt dem Datenspeicher die bereitgestellten Dokumente hinzu. Wenn ein neues Dokument dieselbe ID wie ein vorhandenes Dokument hat, wird das alte Dokument durch das neue ersetzt.
- Vorhandene Daten überschreiben:Alle vorhandenen Daten werden gelöscht und neue Daten werden hochgeladen. Diese Aktion kann nicht rückgängig gemacht werden.
FAQ-Datenspeicher
Datenspeicher können Antworten auf häufig gestellte Fragen enthalten. Wenn Nutzerfragen mit hoher Wahrscheinlichkeit einer hochgeladenen Frage zugeordnet werden, gibt der Kundenservicemitarbeiter die Antwort auf diese Frage unverändert zurück. Sie können für jedes Frage- und Antwortpaar, das der Agent anzeigt, einen Titel und eine URL angeben.
Laden Sie Daten im CSV-Format in den Datenspeicher hoch. Jede Datei muss eine Kopfzeile enthalten, in der die Spalten beschrieben werden.
Beispiel:
"question","answer","title","url"
"Why is the sky blue?","The sky is blue because of Rayleigh scattering.","Rayleigh scattering","https://en.wikipedia.org/wiki/Rayleigh_scattering"
"What is the meaning of life?","42","",""
Sie können die Spalten title und url weglassen:
"answer","question"
"42","What is the meaning of life?"
Während des Uploads können Sie einen Ordner auswählen, in dem jede Datei unabhängig von der Dateiendung als CSV-Datei verarbeitet wird.
Einschränkungen:
- Ein zusätzliches Leerzeichen nach
,führt zu einem Fehler. - Leere Zeilen (auch am Ende der Datei) führen zu einem Fehler.
Datenspeicher für unstrukturierte Daten
Datenspeicher mit unstrukturierten Daten können Inhalte in den folgenden Formaten enthalten:
HTMLPDFTXTCSV
Sie können Dateien aus dem Cloud Storage-Bucket eines anderen Projekts importieren. Dazu müssen Sie dem Importvorgang expliziten Zugriff gewähren. Folgen Sie der Anleitung in der Fehlermeldung. Sie enthält den Namen des Nutzers, der Lesezugriff auf den Bucket benötigt, um den Import auszuführen.
Einschränkungen:
- Die maximale Dateigröße beträgt 2,5 MB für textbasierte Formate und 100 MB für andere Formate.
Datenspeicher mit Metadaten
Sie können einen Titel und URL als Metadaten angeben. Während einer Unterhaltung kann der Kundenservicemitarbeiter diese Informationen bereitstellen, damit Nutzer schnell Links zu internen Webseiten erstellen können, auf die der Google Suche-Indexer nicht zugreifen kann.
Wenn Sie Inhalte mit Metadaten importieren möchten, müssen Sie eine oder mehrere JSON Lines-Dateien bereitstellen. Jede Zeile in dieser Datei beschreibt ein Dokument. Sie laden die eigentlichen Dokumente nicht direkt hoch. URIs, die auf die Cloud Storage-Pfade verweisen, werden in der JSON Lines-Datei angegeben.
Geben Sie einen Cloud Storage-Ordner an, der diese Dateien enthält. Legen Sie keine anderen Dateien in diesen Ordner.
Feldbeschreibungen:
| Feld | Typ | Beschreibung |
|---|---|---|
| id | String | Eindeutige Kennung des Dokuments. |
| content.mimeType | String | MIME-Typ des Dokuments. „application/pdf“ und „text/html“ werden unterstützt. |
| content.uri | String | URI für das Dokument in Cloud Storage. |
| structData | String | Einzeiliges JSON-Objekt mit optionalen Feldern title und url. |
Beispiel:
{ "id": "d001", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/first_doc.pdf"}, "structData": {"title": "First Document", "url": "https://internal.example.com/documents/first_doc.pdf"} }
{ "id": "d002", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/second_doc.pdf"}, "structData": {"title": "Second Document", "url": "https://internal.example.com/documents/second_doc.pdf"} }
{ "id": "d003", "content": {"mimeType": "text/html", "uri": "gs://example-import/unstructured/mypage.html"}, "structData": {"title": "My Page", "url": "https://internal.example.com/mypage.html"} }
Datenspeicher ohne Metadaten
Für diese Art von Inhalten sind keine Metadaten verfügbar. Stattdessen geben Sie URI-Links zu den einzelnen Dokumenten an. Der Inhaltstyp wird durch die Dateiendung bestimmt.
Konfiguration für das Parsen und Aufteilen in Blöcke
Je nach Datenquelle können Sie Einstellungen zum Parsen und Aufteilen konfigurieren, die von Agent Search definiert werden.
Cloud Storage für ein Datenspeicher-Dokument verwenden
Wenn Ihre Inhalte nicht öffentlich sind, sollten Sie sie in Cloud Storage speichern. Wenn Sie Datenspeicher-Dokumente erstellen, geben Sie die URLs für Ihre Cloud Storage-Objekte im folgenden Format an:
gs://bucket-name/folder-name. Jedes Dokument im Ordner wird dem Datenspeicher hinzugefügt.
Beim Erstellen des Cloud Storage-Bucket:
- Wählen Sie das Projekt aus, das Sie für den Agent verwenden.
- Verwenden Sie die Standard Storage-Klasse.
- Legen Sie den Bucket-Speicherort auf denselben Standort wie Ihren Agent fest.
Folgen Sie der Cloud Storage-Kurzanleitung, um einen Bucket zu erstellen und Dateien hochzuladen.
Sprachen
Informationen zu den unterstützten Sprachen finden Sie in der Spalte „Datenspeicher“ in der Sprachreferenz.
Für eine optimale Leistung sollten Sie Datenspeicher in einer einzigen Sprache erstellen.
Nachdem Sie einen Datenspeicher erstellt haben, können Sie optional die Sprache des Datenspeichers angeben. Wenn Sie die Sprache des Datenspeichers festlegen, können Sie den Datenspeicher mit einem Agenten verbinden, der für eine andere Sprache konfiguriert ist. Sie können beispielsweise einen französischen Datenspeicher erstellen, der mit einem englischen KI-Agenten verbunden ist.
Unterstützte Regionen
Informationen zu unterstützten Regionen finden Sie in der Regionsreferenz.
(Eingeschränkter Zugriff) Zusätzliche Quellen für Datenspeicher
Zusätzliche Datenspeichertypen sind in der folgenden Tabelle aufgeführt. Sie sind als Funktionen mit eingeschränktem Zugriff verfügbar. Sie können das Zugriffsanfrageformular ausfüllen, um Zugriff anzufordern. Nach der Genehmigung werden diese Optionen angezeigt, wenn Sie einen Datenspeicher in Vertex AI Agent Builder erstellen.
Datenspeicherquellen von Drittanbietern
| Datenspeicherquelle | Beschreibung |
|---|---|
| Hinweise für Box | Importieren Sie Daten von der Box-Website Ihrer Organisation. |
| Confluence Cloud | Importieren Sie Daten aus Ihrem Confluence Cloud-Workspace. |
| Dropbox | Importieren Sie Daten aus Ihrem Dropbox-Speicher. |
| EntraID | Daten aus dem EntraID-System Ihrer Organisation importieren |
| Jira Cloud | Importieren Sie Daten aus Ihrem Jira-Aufgabenverwaltungssystem. |
| OneDrive | Importieren Sie Daten aus dem OneDrive-Speicher Ihrer Organisation. |
| Microsoft Outlook | Importieren Sie Daten aus Microsoft Outlook. |
| Salesforce | Daten aus Salesforce importieren |
| ServiceNow | Daten aus ServiceNow importieren |
| SharePoint | Importieren Sie Daten aus dem SharePoint-System Ihrer Organisation. |
| Slack | Daten aus Slack importieren |
| Microsoft Teams | Importieren Sie Daten aus Microsoft Teams. |
Drittanbieter-Datenspeicher mit einem Connector einrichten
In diesem Abschnitt wird beschrieben, wie Sie einen Datenspeicher mit Drittanbieterdaten einrichten. Eine Anleitung für die einzelnen Drittanbieter-Datenquellen finden Sie in der Dokumentation zu Generative AI App Builder.
Identitätsanbieter
Mit Identitätsanbietern können Sie Nutzer, Gruppen und die Authentifizierung verwalten. Wenn Sie einen Drittanbieter-Datenspeicher einrichten, können Sie entweder einen Google-Identitätsanbieter oder einen Drittanbieter-Identitätsanbieter verwenden.
Google-Identitätsanbieter:
- Nutzer des Agents melden sich mit ihren Google-Anmeldedaten an. Das kann eine beliebige
@gmail.com-E-Mail-Adresse oder ein beliebiges Konto sein, bei dem Google als Identitätsanbieter verwendet wird (z. B. Google Workspace). Dieser Schritt wird übersprungen, wenn Nutzer direkt über Google Cloud mit dem Agent interagieren, da die Google-Identität automatisch in das System integriert ist. - Sie können den Zugriff auf Google-Konten mithilfe von Identity and Access Management (IAM) zuweisen.
Externer Identitätsanbieter:
- Nutzer des Agents melden sich mit Anmeldedaten an, die nicht von Google stammen, z. B. mit einer Microsoft-E-Mail-Adresse.
- Sie müssen einen Personalpool mit Google Cloud erstellen, der die Nicht-Google-Identitätsanbieter enthält. Anschließend können Sie mit IAM Zugriff auf den gesamten Pool oder auf einzelne Nutzer in diesem Pool gewähren.
- Diese Methode kann nicht für Google Cloud -Projekte verwendet werden, die unter der Organisation
@google.comeingerichtet wurden.
Connectors
Drittanbieter-Datenspeicher werden über einen Connector implementiert. Jeder Connector kann mehrere Datenspeicher enthalten, die als Entitäten im Dialogflow CX-System gespeichert werden.
- Bevor Sie einen Datenspeicher erstellen, müssen Sie jede Region mit einem einzelnen Identitätsanbieter in Google Cloud > Agent Builder > Einstellungen einrichten. Alle Datenspeicher in dieser Region verwenden denselben Identitätsanbieter. Sie können entweder eine Google-Identität oder eine Drittanbieteridentität in einem Personalpool auswählen. Dasselbe Google-Anmeldedaten werden als andere Identität betrachtet, wenn sie sich in einem Mitarbeiteridentitätspool befinden.
test@gmail.comgilt beispielsweise als andere Identität alsworkforcePools/test-pool/subject/test@gmail.com.- Erstellen Sie bei Bedarf einen Workforce-Pool.
- Gehen Sie zu Agent Builder > Einstellungen und wählen Sie entweder Google Identity oder Identität von Drittanbieter aus. Klicken Sie auf Speichern, um die Identität für die Region zu speichern.
- Sie können jetzt einen Datenspeicher in der Region erstellen.
- In jedem Datenspeicher werden ACL-Daten (Access Control List, Zugriffssteuerungsliste) mit jedem Dokument gespeichert. In diesem Datensatz wird erfasst, welche Nutzer oder Gruppen Lesezugriff auf welche Einheiten haben. Während der Laufzeit erhält ein Nutzer oder ein Gruppenmitglied nur Antworten vom Agent, wenn die Antworten aus Einheiten stammen, auf die er Lesezugriff hat. Wenn ein Nutzer keinen Lesezugriff auf Einheiten im Datenspeicher hat, gibt der Agent eine leere Antwort zurück.
- Da die Daten im Datenspeicher eine Kopie der Drittanbieterinstanz sind, müssen sie regelmäßig aktualisiert werden. Sie können die Aktualisierungsintervalle auf einer Zeitskala von Stunden oder Tagen konfigurieren.
- Nachdem Sie den Datenspeicher konfiguriert und auf Erstellen geklickt haben, kann es bis zu einer Stunde dauern, bis der Datenspeicher in der Liste der Datenspeicher angezeigt wird.
Tracing von Datenspeichern
Diese Funktion besteht aus zwei Teilen:
- Anzeige der internen Ausführungstraces des Datenspeichers und der Schrittlatenzen im Agentsimulator.
- Export der internen Ausführungs-Traces und Schrittlatenzen des Datenspeichers in Cloud Logging und BigQuery.
Daten im Simulator ansehen
Wenn Sie Tracing- und Ausführungsdaten im Agent-Simulator aufrufen möchten, maximieren Sie die Details zu einem Gesprächsabschnitt, indem Sie rechts neben der Antwort des Agenten auf den Pfeil zum Maximieren klicken.
Auf dem Tab Ausführung werden die Ausführungs-Traces des internen Datenspeichers angezeigt, darunter:
- Die ursprüngliche Nutzereingabe.
- Die von der Datenspeicher-Engine umgeschriebene Abfrage.
- Qualitätssignale aus Ausführungsschritten, z. B. Sicherheitscheckstatus, Stabilitätscheckstatus, Ergebnis des Fundierungschecks und Sicherheitscheckstatus.
- Such-Snippets aus der Datenspeichersuche.
- Die Liste der unterstützenden Dokumente für die Snippets.
Auf dem Tab Latenz wird ein Zeitdiagramm für verschiedene Ausführungsschritte des Datenspeichers angezeigt. Die Liste der Schritte variiert je nach Konfiguration des Datenspeichers und Ausführungsablauf. Die angezeigten Daten können Folgendes umfassen:
- FAQ-Abgleich:Führt einen FAQ-Abgleich durch.
- Abfrage neu formulieren:Die ursprüngliche Nutzerabfrage wird neu formuliert.
- Suche:Führt eine Snippet-Suche durch.
- Zusammenfassung:Die Antwort wird zusammengefasst.
- Sicherheitschecks:Führt Schritte zur Sicherheitsüberprüfung durch.
Tracing-Daten an anderen Orten ansehen
- Wenn Sie den Konversations-Agenten mit Logging des Unterhaltungsverlaufs konfigurieren, können Sie die Datenspeicherverfolgung im Unterhaltungsverlauf ansehen.
- Wenn Sie den Conversational-Agent mit Logging konfigurieren, können Sie Tracings und Latenzen im Logs Explorer in der Cloud ansehen.
- Wenn Sie den Conversational AI-Agent mit BigQuery-Export konfigurieren, können Sie Traces und Latenzen in einer exportierten BigQuery-Tabelle ansehen.
Nächste Schritte
Informationen zum Erstellen und Verwenden eines Datenspeichers mit einem Agenten finden Sie in der Dokumentation zu Datenspeichertools.