Snippets und extraktive Inhalte abrufen

Zur Verbesserung der Ergebnisse kann Gemini Enterprise mit jeder Suchantwort Such-Snippets, extraktive Antworten und extraktive Segmente bereitstellen.

  • Snippets: Ein Snippet ist ein kurzer Textauszug aus dem Suchergebnisdokument, der eine Vorschau auf den Inhalt eines Suchergebnisses bietet. Darin sind die Treffer hervorgehoben, die Sie in Ihrer Benutzeroberfläche rendern können. Snippets werden in der Regel unter jedem Suchergebnis angezeigt, damit Endnutzer die Relevanz und Nützlichkeit des jeweiligen Ergebnisses besser einschätzen können. Snippets sind für Datenspeicher mit unstrukturierten Daten verfügbar.

  • Extraktive Antworten: Antworten, die wortwörtlich mit Ihren Suchergebnissen zurückgegeben werden. Sie werden direkt aus dem Originaldokument extrahiert. Extraktive Antworten werden in der Regel oben auf Webseiten angezeigt. Sie geben Endnutzern eine kurze Antwort, die kontextuell relevant für ihre Anfrage ist. Extraktive Antworten sind für Datenspeicher mit unstrukturierten Daten verfügbar.

  • Extraktive Segmente: Ein extraktives Segment ist Text, der wortwörtlich mit jedem Suchergebnis zurückgegeben wird. Ein extraktives Segment ist in der Regel ausführlicher als eine extraktive Antwort. Extraktive Segmente können als Antwort auf eine Anfrage angezeigt und für die Nachbearbeitung sowie als Eingabe für Large Language Models verwendet werden, um Antworten oder neuen Text zu generieren. Extraktive Segmente sind für Datenspeicher mit unstrukturierten Daten verfügbar.

Beispiele

Die folgenden Beispiele veranschaulichen die Unterschiede zwischen Snippets, extraktiven Antworten und extraktiven Segmenten.

Anfrage: „Was ist ein Beispielprodukt?“

  • Snippet:

    Dazu stellen wir unser neues Beispielprodukt von Google vor. Damit können Entwickler schnell mit der Entwicklung von Apps wie Bots beginnen, ...

  • Extraktive Antwort:

    Mit dem Beispielprojekt von Google können Entwickler schnell neue Funktionen wie Bots, Chat-Oberflächen, benutzerdefinierte Suchmaschinen und digitale Assistenten entwickeln. Entwickler haben API-Zugriff auf die Foundation Models von Google und können sofort einsatzbereite Vorlagen verwenden, um in wenigen Minuten oder Stunden generative Apps zu erstellen.

  • Extraktives Segment:

    Unternehmen und Behörden möchten mit dieser neuen KI-Technologie auch Kunden-, Partner- und Mitarbeiterinteraktionen effektiver und hilfreicher gestalten. Dazu stellen wir unser neues Beispielprodukt von Google vor.

    Mit dem Beispielprojekt von Google können Entwickler schnell neue Funktionen wie Bots, Chat-Oberflächen, benutzerdefinierte Suchmaschinen und digitale Assistenten entwickeln. Entwickler haben API-Zugriff auf die Foundation Models von Google und können sofort einsatzbereite Vorlagen verwenden, um in wenigen Minuten oder Stunden generative Apps zu erstellen. Mit dem Beispielprojekt von Google haben Entwickler außerdem folgende Möglichkeiten:

    • Zur Ausgabe relevanter Antworten Organisationsdaten und Methoden zum Informationsabruf kombinieren
    • Suchen und antworten mit mehr als nur Text
    • Natürliche Unterhaltungen mit strukturierten Abläufen kombinieren
    • Nicht nur informieren, sondern auch Transaktionen durchführen

Snippets

Snippets sind kurze Textausschnitte, die wörtlich aus den Dokumenten der einzelnen Suchergebnisse extrahiert werden. Treffer werden in fetten HTML-Tags hervorgehoben, um eine Vorschau der Suchergebnisse in einer Benutzeroberfläche anzuzeigen. In der Regel werden Snippets als Vorschautext unter einem Suchergebnis gerendert, damit Endnutzer entscheiden können, ob es sinnvoll ist, auf dieses Suchergebnis zu klicken.

Snippets sind für unstrukturierte Daten verfügbar.

Snippets abrufen

So rufen Sie Snippets ab:

  1. Senden Sie eine Suchanfrage, die ContentSearchSpec.SnippetSpec enthält und bei der returnSnippet auf „true“ gesetzt ist.

    Im folgenden Beispiel für SnippetSpec ist festgelegt, dass für jedes Suchergebnis ein Snippet zurückgegeben werden kann.

    "contentSearchSpec":
    {
      "snippetSpec":
      {
        "returnSnippet": true
      }
    }
    • returnSnippet: Wenn true festgelegt ist, wird ein Snippet zurückgegeben.
  2. Rufen Sie Snippets aus der Antwort auf die Suchanfrage ab. Mit jedem Suchergebnis in derivedStructData.snippets werden Snippets zurückgegeben.

    Dieses Beispiel zeigt ein Dokument, das als Ergebnis in einer Suchantwort zurückgegeben wurde. Das Ergebnis enthält ein Snippet mit fettgedruckter Hervorhebung der Treffer:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf",
          "snippets": [
            {
              "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.",
              "snippet_status": "SUCCESS"
            }
          ]
        }
      }
    }
    • snippet: Enthält ein Snippet, das für das Dokumentensuchergebnis generiert wurde. Die Hervorhebung der Treffer erfolgt durch HTML-Tags für Fettformatierung.
    • snippet_status: Bei der Generierung eines Snippets wird dieses Feld als SUCCESS zurückgegeben. Wenn kein Snippet generiert wird, lautet dieses Feld NO_SNIPPET_AVAILABLE.

Extraktive Antworten

Eine extraktive Antwort ist ein Textabschnitt, der wortwörtlich aus einem Dokument extrahiert wurde. Kommt ein Dokument als Suchergebnis in einer Suchantwort zurück, kann gleichzeitig eine relevante extraktive Antwort zurückgegeben werden.

Extraktive Antworten können Texte wie Absätze, Tabellen oder Aufzählungslisten sein, die aus dem Suchergebnisdokument extrahiert werden. Extraktive Antworten sind kürzer als extraktive Segmente.

Extraktive Antworten können als Alternative zu zusammengefassten Antworten verwendet werden, wenn präzise, wörtliche Antworten gegenüber umformulierten Zusammenfassungen vorzuziehen sind.

Extraktive Antworten sind für Datenspeicher mit unstrukturierten Daten verfügbar.

Extraktive Antworten abrufen

So rufen Sie extraktive Antworten ab:

  1. Senden Sie eine Suchanfrage, die ContentSearchSpec.extractiveContentSpec verwendet, um maxExtractiveAnswerCount anzugeben.

    Im folgenden Beispiel für extractiveContentSpec wird festgelegt, dass für jedes Suchergebnis eine Antwort zurückgegeben werden kann.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveAnswerCount": 1
      }
    }
    • maxExtractiveAnswerCount: Anzahl der pro Suchergebnis zurückzugebenden extraktiven Antworten. Der Standardwert ist 0, der Höchstwert ist 5.
  2. Rufen Sie extraktive Antworten aus der Suchantwort ab. Extraktive Antworten werden mit jedem Suchergebnis in extractive_answers zurückgegeben.

    Dieses Beispiel zeigt ein Dokument, das als Ergebnis einer Suchantwort zurückgegeben wurde. Es enthält eine extraktive Antwort:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_answers": [
            {
              "pageNumber": "2",
              "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion."
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: Wenn Seitenzahlen aus dem Dokument extrahiert werden können, gibt dieses Feld an, woher die Antwort extrahiert wurde.
    • content: Der Inhalt der extraktiven Antwort.

Extraktive Segmente

Ein extraktives Segment ist ein Textabschnitt, der wortwörtlich aus einem Suchergebnisdokument extrahiert wurde. Extraktive Segmente ähneln extraktiven Antworten, sind aber in der Regel vollständiger und ausführlicher. Normalerweise werden extraktive Segmente als Eingabe für die eigenen LLMs verwendet, um Antworten oder neuen Text zu generieren.

Extraktive Segmente können mehrere Absätze umfassen, einschließlich formatiertem Text wie Tabellen und Aufzählungslisten.

Extraktive Segmente sind für Datenspeicher mit unstrukturierten Daten verfügbar.

Optionen für extraktive Segmente

Für extraktive Segmente sind die folgenden Optionen verfügbar:

  • Anzahl der Segmente: Pro Suchergebnis können bis zu 10 extraktive Segmente zurückgegeben werden.

  • Relevanzwerte: Relevanzwerte basieren auf der Ähnlichkeit der Anfrage mit dem extrahierten Segment. Sie können festlegen, dass extraktive Segmente mit Relevanzwerten zurückgegeben werden. Die Werte reichen von -1,0 (weniger relevant) bis 1,0 (relevanter). Das Aktivieren von Relevanzwerten kann die Latenz erhöhen.

  • Angrenzende Segmente: Durch Festlegen von numPreviousSegments und numNextSegments können bis zu drei Segmente unmittelbar vor und nach dem relevanten Segment abgerufen werden. Angrenzende Segmente können dem relevanten Segment Kontext und Genauigkeit hinzufügen.

    Das Aktivieren angrenzender Segmente kann die Latenz erhöhen.

Extraktive Segmente abrufen

Die folgenden Schritte zeigen, wie Sie extraktive Segmente für unstrukturierte Daten abrufen.

  1. Senden Sie eine Suchanfrage, die ContentSearchSpec.extractiveContentSpec verwendet, um maxExtractiveSegmentCount anzugeben.

    Im folgenden Beispiel für extractiveContentSpec wird festgelegt, dass für jedes Suchergebnis ein Segment zurückgegeben werden kann.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveSegmentCount": 1
      }
    }
    • maxExtractiveSegmentCount: Anzahl der pro Suchergebnis zurückzugebenden extraktiven Segmente. Der Standardwert ist 0, der Höchstwert ist 10.

    Zusätzliche Optionen:

    • returnExtractiveSegmentScore: Setzen Sie diesen Wert auf true, um einen Relevanzwert für jedes zurückgegebene Segment zu erhalten.
    • numPreviousSegments: Die Anzahl der angrenzenden Segmente, die vor dem relevanten Segment zurückgegeben werden sollen. Der Standardwert ist 0, der Höchstwert ist 3. Die Verwendung angrenzender Segmente kann die Latenz erhöhen.
    • numNextSegments: Die Anzahl der angrenzenden Segmente, die nach dem relevanten Segment zurückgegeben werden sollen. Der Standardwert ist 0, der Höchstwert ist 3. Die Verwendung angrenzender Segmente kann die Latenz erhöhen.

    Weitere Informationen zu diesen Optionen finden Sie unter Optionen für extraktive Segmente.

  2. Rufen Sie Segmente aus der Suchantwort ab. Segmente werden mit jedem Suchergebnis in extractive_segments zurückgegeben.

    Dieses Beispiel zeigt ein Dokument, das als Ergebnis einer Suchantwort zurückgegeben wurde. Das Ergebnis enthält ein Segment:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_segments": [
            {
              "pageNumber": "2",
              "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5"
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: Wenn Seitenzahlen aus dem Dokument extrahiert werden können, gibt dieses Feld an, woher die Antwort extrahiert wurde.
    • content: Der Inhalt des extraktiven Segments.

Nächste Schritte