Snippets und extrahierte Inhalte abrufen

Vertex AI Search kann mit jeder Suchantwort Such-Snippets, extrahierte Antworten und extrahierte Segmente bereitstellen, um Ihre Ergebnisse zu verbessern.

  • Snippets: Ein Snippet ist ein kurzer Textauszug aus dem Dokument des Suchergebnisses, der eine Vorschau des Inhalts eines Suchergebnisses bietet. Sie enthält die Hervorhebung von Treffern, die Sie in Ihrer Benutzeroberfläche rendern können. Snippets werden in der Regel unter jedem Suchergebnis angezeigt, damit Endnutzer die Relevanz und Nützlichkeit des jeweiligen Ergebnisses besser einschätzen können. Snippets sind für Datenspeicher mit unstrukturierten Daten und Websitedaten verfügbar (sowohl für die grundlegende als auch für die erweiterte Websiteindexierung).

  • Extraktionsantworten: Eine Extraktionsantwort ist ein wörtlicher Text, der mit jedem Suchergebnis zurückgegeben wird. Sie wird direkt aus dem Originaldokument extrahiert. Extraktive Antworten werden in der Regel oben auf Webseiten angezeigt, um Endnutzern eine kurze Antwort zu geben, die kontextuell relevant für ihre Anfrage ist. Extrahierte Antworten sind für Datenspeicher mit unstrukturierten Daten und mit erweiterter Websiteindexierung verfügbar.

  • Extraktive Segmente: Ein extraktives Segment ist ein wörtlicher Text, der mit jedem Suchergebnis zurückgegeben wird. Ein extraktives Segment ist in der Regel ausführlicher als eine extraktive Antwort. Extrahierte Segmente können als Antwort auf eine Anfrage angezeigt und für die Nachbearbeitung sowie als Eingabe für Large Language Models verwendet werden, um Antworten oder neuen Text zu generieren. Extrahierungssegmente sind für Datenspeicher mit unstrukturierten Daten und erweiterter Websiteindexierung verfügbar.

Beispiele

Die folgenden Beispiele veranschaulichen die Unterschiede zwischen Snippets, extraktiven Antworten und extraktiven Segmenten.

Anfrage: „Was ist Vertex AI Search?“

  • Snippet:

    Dazu stellen wir Vertex AI Search vor, die schnellste Möglichkeit für Entwickler, mit der Erstellung von generativen Apps wie Bots zu beginnen.

  • Extraktive Antwort:

    Mit Vertex AI Search können Entwickler schnell neue Funktionen wie Bots, Chat-Oberflächen, benutzerdefinierte Suchmaschinen und digitale Assistenten entwickeln. Entwickler haben API-Zugriff auf die Foundation Models von Google und können sofort einsatzbereite Vorlagen verwenden, um in wenigen Minuten oder Stunden generative Apps zu erstellen.

  • Extraktives Segment:

    Unternehmen und Behörden möchten mit dieser neuen KI-Technologie auch Kunden-, Partner- und Mitarbeiterinteraktionen effektiver und hilfreicher gestalten. Dazu stellen wir Ihnen die neue Vertex AI Search zur Verfügung.

    Mit Vertex AI Search können Entwickler schnell neue Funktionen wie Bots, Chat-Oberflächen, benutzerdefinierte Suchmaschinen und digitale Assistenten entwickeln. Entwickler haben API-Zugriff auf die Foundation Models von Google und können sofort einsatzbereite Vorlagen verwenden, um in wenigen Minuten oder Stunden generative Apps zu erstellen. Mit Vertex AI Search können Entwickler außerdem:

    • Organisationsdaten und Techniken zum Abrufen von Informationen kombinieren, um relevante Antworten zu liefern
    • Suchen und antworten Sie mit mehr als nur Text.
    • Kombinieren Sie natürliche Unterhaltungen mit strukturierten Abläufen.
    • Nicht nur informieren, sondern auch Transaktionen ermöglichen

Hinweise

Je nach Art der App müssen Sie die folgenden Voraussetzungen erfüllen:

Snippets

Snippets sind kurze Textausschnitte, die wörtlich aus den Dokumenten der einzelnen Suchergebnisse extrahiert werden. Sie enthalten die Hervorhebung von Treffern in fett formatierten HTML-Tags für die Darstellung von Vorschauen von Suchergebnissen in einer Benutzeroberfläche. In der Regel werden Snippets als Vorschautext unter einem Suchergebnis gerendert, damit Endnutzer entscheiden können, ob es sinnvoll ist, auf dieses Suchergebnis zu klicken.

Snippets sind für die Website- und die unstrukturierte Suche verfügbar.

Ausschnitte abrufen

So erhalten Sie Snippets:

  1. Senden Sie eine Suchanfrage, die ContentSearchSpec.SnippetSpec enthält und returnSnippet auf „true“ setzt.

    Im folgenden Beispiel für SnippetSpec wird angegeben, dass für jedes Suchergebnis ein Snippet zurückgegeben werden kann.

    "contentSearchSpec":
    {
      "snippetSpec":
      {
        "returnSnippet": true
      }
    }
    • returnSnippet: Wenn dieser Wert auf true gesetzt ist, wird ein Snippet zurückgegeben.
  2. Rufen Sie Snippets aus der Antwort auf die Suchanfrage ab. Snippets werden mit jedem Suchergebnis in derivedStructData.snippets zurückgegeben.

    In diesem Beispiel für ein Dokument, das als eines der Ergebnisse in einer Suchantwort zurückgegeben wurde, ist ein Snippet mit fett hervorgehobenen Treffern enthalten:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf",
          "snippets": [
            {
              "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.",
              "snippet_status": "SUCCESS"
            }
          ]
        }
      }
    }
    • snippet: Enthält ein Snippet, das für das Dokument-Suchergebnis generiert wurde. Die Hervorhebung von Treffern erfolgt durch HTML-Tags für Fettformatierung.
    • snippet_status: Wenn ein Snippet generiert wird, wird dieses Feld als SUCCESS zurückgegeben. Wenn kein Snippet generiert wird, wird dieses Feld als NO_SNIPPET_AVAILABLE zurückgegeben.

Extraktive Antworten

Eine extraktive Antwort ist ein Textabschnitt, der wortwörtlich aus einem Dokument stammt. Wenn ein Dokument in einer Suchantwort als Suchergebnis zurückgegeben wird, kann mit diesem Ergebnis eine relevante extraktive Antwort zurückgegeben werden.

Eine extraktive Antwort kann Text wie ein Absatz, eine Tabelle oder eine Aufzählungsliste sein, der aus dem Dokument mit dem Suchergebnis extrahiert wird. Extrahierte Antworten sind kürzer als extrahierte Segmente.

Extraktive Antworten können als Alternative zu zusammengefassten Antworten verwendet werden, wenn präzise, wörtliche Antworten gegenüber umformulierten Zusammenfassungen bevorzugt werden.

Extrahierende Antworten sind für Datenspeicher mit unstrukturierten Daten und mit erweiterter Websiteindexierung verfügbar.

Extraktive Antworten erhalten

So erhalten Sie extraktive Antworten:

  1. Senden Sie eine Suchanfrage, in der maxExtractiveAnswerCount mit ContentSearchSpec.extractiveContentSpec angegeben wird.

    Im folgenden Beispiel für extractiveContentSpec wird angegeben, dass für jedes Suchergebnis eine Antwort zurückgegeben werden kann.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveAnswerCount": 1
      }
    }
    • maxExtractiveAnswerCount: Die Anzahl der extraktiven Antworten, die für jedes Suchergebnis zurückgegeben werden sollen. Der Standardwert ist 0 und der Höchstwert ist 5.
  2. Extrahieren Sie Antworten aus der Antwort auf die Suchanfrage. Extraktive Antworten werden mit jedem Suchergebnis in extractive_answers zurückgegeben.

    In diesem Beispiel für ein Dokument, das als eines der Ergebnisse in einer Suchantwort zurückgegeben wurde, ist eine extraktive Antwort enthalten:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_answers": [
            {
              "pageNumber": "2",
              "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion."
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: Wenn Seitenzahlen aus dem Dokument extrahiert werden können, gibt dieses Feld an, wo die Antwort extrahiert wurde.
    • content: Der Inhalt der extraktiven Antwort.

Extraktive Segmente

Ein extraktives Segment ist ein Textabschnitt, der wörtlich aus einem Dokument mit Suchergebnissen extrahiert wird. Extraktive Segmente ähneln extraktiven Antworten, sind aber in der Regel vollständiger und ausführlicher. Extrahierte Segmente werden in der Regel als Eingabe für Ihre eigenen LLMs verwendet, um Antworten oder neuen Text zu generieren.

Extrahierte Segmente können mehrere Absätze mit formatiertem Text wie Tabellen und Aufzählungslisten umfassen.

Extrahierungssegmente sind für Datenspeicher mit unstrukturierten Daten und erweiterter Websiteindexierung verfügbar.

Optionen für extraktive Segmente

Für extraktive Segmente sind die folgenden Optionen verfügbar:

  • Anzahl der Segmente: Sie können bis zu 10 extrahierte Segmente angeben, die für jedes Suchergebnis zurückgegeben werden sollen.

  • Relevanzwerte: Relevanzwerte basieren auf der Ähnlichkeit der Anfrage zum extrahierten Segment. Sie können festlegen, dass extraktive Segmente mit Relevanzwerten zurückgegeben werden. Die Werte reichen von -1,0 (weniger relevant) bis 1,0 (relevanter). Wenn Sie Relevanzbewertungen aktivieren, kann dies die Latenz erhöhen.

  • Benachbarte Segmente: Sie können numPreviousSegments und numNextSegments festlegen, um bis zu drei Segmente unmittelbar vor und nach dem relevanten Segment zu erhalten. Angrenzende Segmente können dem relevanten Segment Kontext und Genauigkeit hinzufügen.

    Wenn Sie angrenzende Segmente aktivieren, kann sich die Latenz erhöhen.

Extraktive Segmente abrufen

Die folgenden Schritte zeigen, wie Sie extraktive Segmente für unstrukturierte Daten abrufen. Sie können ähnliche Schritte ausführen, um extraktive Segmente für Websitedaten zu erhalten.

  1. Senden Sie eine Suchanfrage, in der maxExtractiveSegmentCount mit ContentSearchSpec.extractiveContentSpec angegeben wird.

    Im folgenden Beispiel für extractiveContentSpec wird angegeben, dass für jedes Suchergebnis ein Segment zurückgegeben werden kann.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveSegmentCount": 1
      }
    }
    • maxExtractiveSegmentCount: Die Anzahl der extraktiven Segmente, die für jedes Suchergebnis zurückgegeben werden sollen. Der Standardwert ist 0 und der Höchstwert ist 10.

    Zusätzliche Optionen:

    • returnExtractiveSegmentScore: Legen Sie den Wert auf true fest, um mit jedem zurückgegebenen Segment einen Relevanzwert zurückzugeben.
    • numPreviousSegments: Die Anzahl der angrenzenden Segmente, die vor dem relevanten Segment zurückgegeben werden sollen. Der Standardwert ist 0 und der maximale Wert ist 3. Die Verwendung angrenzender Segmente kann die Latenz erhöhen.
    • numNextSegments: Die Anzahl der angrenzenden Segmente, die nach dem relevanten Segment zurückgegeben werden sollen. Der Standardwert ist 0 und der maximale Wert ist 3. Die Verwendung angrenzender Segmente kann die Latenz erhöhen.

    Weitere Informationen zu diesen Optionen finden Sie unter Optionen für extraktive Segmente.

  2. Rufen Sie Segmente aus der Antwort auf die Suchanfrage ab. Segmente werden mit jedem Suchergebnis in extractive_segments zurückgegeben.

    In diesem Beispiel für ein Dokument, das als eines der Ergebnisse in einer Suchantwort zurückgegeben wurde, ist ein Segment mit dem Ergebnis enthalten:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_segments": [
            {
              "pageNumber": "2",
              "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5"
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: Wenn Seitenzahlen aus dem Dokument extrahiert werden können, gibt dieses Feld an, wo die Antwort extrahiert wurde.
    • content: Der Inhalt des extraktiven Segments.

Nächste Schritte