Apps und Datenspeicher

Auf dieser Seite werden Gemini Enterprise-Apps und Datenspeicher beschrieben.

Mit Gemini Enterprise erstellen Sie eine App und verbinden diese mit einem Datenspeicher. Ein Google Cloud -Projekt kann mehrere Apps enthalten.

Wichtige Begriffe:

  • App: Eine Gemini Enterprise-App bietet Endnutzern Suchergebnisse, Aktionen und KI-Agenten. Der Begriff App wird im Zusammenhang mit APIs synonym zum Begriff Engine verwendet.

  • Datenspeicher: Ein Datenspeicher ist eine Entität, in die selbst erhobene Daten aus Quellen wie Cloud Storage oder Drittanbieteranwendungen wie Jira oder Salesforce aufgenommen wurden. Datenspeicher mit Daten aus Drittanbieteranwendungen werden auch Daten-Connectors genannt.

Beziehung zwischen Apps und Datenspeichern

Eine App muss mit einem Datenspeicher verbunden sein, damit die Daten daraus für die Bereitstellung von Suchergebnissen, Antworten oder Aktionen verwendet werden können.

Apps haben eine m:n-Beziehung zu Datenspeichern. Wenn mit einer einzelnen App mehrere Datenspeicher verbunden sind, wird dies als zusammengeführte Suche bezeichnet. Informationen zu Einschränkungen beim Verbinden einer Such-App mit mehreren Datenspeichern finden Sie unter Zusammengeführte Suche.

Methode zum Erstellen von Apps und zur Datenaufnahme

Wie Sie eine App erstellen und Daten aufnehmen, hängt vom Datentyp ab:

  • Für Drittanbieterdaten verwenden Sie die Google Cloud Console und nicht die API, um Ihre App zu erstellen und Daten aufzunehmen.

  • Für andere Daten können Sie entweder die Google Cloud Console oder die API verwenden.

Dokumente

Jeder Datenspeicher enthält mindestens einen Datensatz, der als Dokument bezeichnet wird. Die Art des Dokuments hängt vom Datentyp im Datenspeicher ab:

  • Daten aus Datenquellen von Drittanbietern: Ein Dokument ist eine Entität, die spezifisch für die Datenquelle des Drittanbieters ist, wie z. B. ein Jira-Problem oder ein Confluence-Bereich.

  • Strukturierte Daten: Ein Dokument ist eine Zeile in einer Tabelle oder ein JSON-Datensatz mit einem bestimmten Schema. Sie können dieses Schema selbst angeben oder Gemini Enterprise das Schema aus den aufgenommenen Daten ableiten lassen.

  • Unstrukturierte Daten: Ein Dokument ist eine Datei im HTML-Format, ein PDF mit eingebettetem Text oder eine TXT-Datei. PPTX- und DOCX-Formate sind in der Vorabversion verfügbar.

Datenspeicher und Apps

In Gemini Enterprise gibt es verschiedene Arten von Datenspeichern. Ein Datenspeicher kann jeweils nur einen Datentyp enthalten.

Strukturierte Daten für Drittanbieter-Datenspeicher

Für folgende Datenquellen von Drittanbietern sind in der Vorabversion mit Zulassungsliste Connectors verfügbar:

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

Die Daten von diesen Drittanbietern gelten als strukturierte Daten.

Wenn Sie einen neuen Connector einrichten, müssen Sie eine Synchronisierungshäufigkeit auswählen und festlegen, welche Entitäten synchronisiert werden sollen. Die Entitäten hängen von der Quelle ab, wie z. B. Jira-Probleme und Confluence-Inhalte und -Bereiche. Für jede Entität wird ein eindeutiger Datenspeicher erstellt. Die Entitätsdatenspeicher werden dann nach Connector-Instanz gruppiert.

Nächste Schritte

Strukturierte Daten

Ein Datenspeicher mit strukturierten Daten ermöglicht semantische Suchen oder Empfehlungen auf Basis strukturierter Daten. Sie können Daten entweder aus BigQuery oder Cloud Storage importieren. Über die API können Sie strukturierte JSON-Daten auch manuell hochladen.

Sie können beispielsweise für einen Produktkatalog Ihrer E-Commerce-Plattform oder ein Ärzteverzeichnis Such- oder Empfehlungsfunktionen aktivieren.

Gemini Enterprise erkennt das Schema automatisch anhand der importierten Daten. Sie können optional auch ein Schema für Ihre Daten angeben. Dadurch wird die Qualität der Ergebnisse in der Regel verbessert.

Nächste Schritte

Unstrukturierte Daten

Ein Datenspeicher mit unstrukturierten Daten ermöglicht semantische Suchen oder Empfehlungen auf Basis von Daten wie Dokumenten und Bildern.

Datenspeicher mit unstrukturierten Daten unterstützen Dokumente im HTML-Format, PDFs mit eingebettetem Text und TXT-Dateien. PPTX- und DOCX-Formate sind in der Vorabversion verfügbar.

Für Anfragen in natürlicher Sprache liefert die Suche Ergebnisse in Form von 10 URLs und zusammengefassten Antworten. Die Dokumente müssen mit den entsprechenden Zugriffsberechtigungen in einen Cloud Storage-Bucket hochgeladen werden. So kann beispielsweise ein Finanzinstitut für seinen privaten Korpus an Finanzpublikationen oder ein Biotech-Unternehmen für sein privates Archiv medizinischer Forschung Suchen oder Empfehlungen aktivieren.

Nächste Schritte

Zusammengeführte Suche

Bei der zusammengeführten Suche sind mehrere Datenspeicher mit einer einzelnen App verbunden. So kann die App in mehreren Quellen und Datentypen suchen.

Wenn Sie eine App für die zusammengeführte Suche erstellen möchten, müssen Sie beim Erstellen mehrere Datenspeicher auswählen. Tun Sie dies nicht, können Sie später keine weiteren Datenspeicher hinzufügen.

Wenn Sie Suchergebnisse abrufen, können Sie entweder in allen Datenspeichern suchen oder nach Ergebnissen aus einem einzelnen Datenspeicher filtern.

Für die zusammengeführte Suche gelten folgende Einschränkungen:

  • Datenspeicher hinzufügen und entfernen:
    • Wenn Sie für eine App die zusammengeführte Suche aktivieren möchten, müssen Sie beim Erstellen der App mindestens zwei Datenspeicher verbinden.
    • Sie können einer App für die zusammengeführte Suche Datenspeicher hinzufügen oder daraus entfernen. Die App muss jedoch immer mit mindestens zwei Datenspeichern verbunden sein.
    • Wenn Sie beim Erstellen einer Such-App nur einen Datenspeicher verbinden, können Sie weder weitere Datenspeicher hinzufügen noch diesen Datenspeicher entfernen.
  • Es werden keine Datenspeicher mit unstrukturierten Daten, die aus BigQuery importiert wurden, unterstützt.
  • Die zusammengeführte Suche unterstützt für Suchanfragen die folgenden Felder:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • Die zusammengeführte Suche unterstützt für dataStoreSpecs die folgenden Felder:
    • dataStore
    • boostSpec: Wenn sowohl für SearchRequest als auch dataStoreSpecs Boost-Spezifikationen angegeben sind, werden beide auf die Suchergebnisse angewendet.
    • filter: Wenn sowohl für SearchRequest als auch dataStoreSpecs Filter angegeben sind, werden beide auf die Suchergebnisse angewendet.
  • Bei Apps für die zusammengeführte Suche werden für Bereitstellungskonfigurationen CRUD-Vorgänge (Create, Read, Update, Delete) unterstützt. In einer Bereitstellungskonfiguration können nur die folgenden Felder hinzugefügt oder aktualisiert werden:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Bei Apps für die zusammengeführte Suche werden für folgende Steuerelemente CRUD-Vorgänge unterstützt:
    • boostAction
    • synonymAction
    • filterAction
  • Pro Such-App sind maximal 50 Datenspeicher zulässig.
  • Wenn ein Datenspeicher eine Konfiguration mit kundenverwalteten Verschlüsselungsschlüsseln verwendet, müssen alle anderen Datenspeicher ebenfalls diese Konfiguration verwenden.