Auf dieser Seite werden Vertex AI Search-Apps und -Datenspeicher beschrieben.
Mit Vertex AI Search erstellen Sie eine Such- oder Empfehlungsanwendung und verbinden sie mit einem Datenspeicher. Ein Google Cloud -Projekt kann mehrere Apps enthalten.
Beziehung zwischen Apps und Datenspeichern
Die Beziehung zwischen Apps und Datenspeichern hängt vom App-Typ ab:
Benutzerdefinierte Suchanwendungen haben eine m:n-Beziehung zu Datenspeichern. Wenn mehrere Datenspeicher mit einer einzelnen benutzerdefinierten Such-App verbunden sind, wird dies als zusammengeführte Suche bezeichnet. Informationen zu Einschränkungen beim Verbinden einer Such-App mit mehreren Datenspeichern finden Sie unter Zusammengeführte Suche.
Eine App für benutzerdefinierte Empfehlungen hat eine 1:1-Beziehung zu ihrem Datenspeicher.
Eine Medienanwendung hat eine n:1-Beziehung zu ihrem Datenspeicher. Eine App kann nur mit einem Datenspeicher verbunden werden, während ein Datenspeicher mit mehreren Apps verbunden werden kann. Beispielsweise können eine Anwendung für die Mediensuche und eine Anwendung für Medienempfehlungen einen Datenspeicher gemeinsam nutzen.
Eine Anwendung zur Suche in Gesundheitsdaten hat eine n:1-Beziehung zu ihrem Datenspeicher. Eine App kann nur mit einem Datenspeicher verbunden werden, während ein Datenspeicher mit mehreren Apps verbunden werden kann. So können beispielsweise eine Anwendung für Patienten und eine Anwendung für Dienstleister mit demselben Datenspeicher verbunden sein.
Beim Batch-Datenimport von Gesundheitsdaten werden Daten in einen Datenspeicher innerhalb einer App importiert. Beim Streaming-Datenimport (Vorabversion) von Gesundheitsdaten werden Daten in eine Entität importiert. Das ist ein Datenspeicher innerhalb eines Daten-Connectors. Ein Daten-Connector ist auch ein Datenspeicher innerhalb einer App.
Sobald ein Datenspeicher mit einer Anwendung verbunden ist, kann er nicht mehr getrennt werden.
Methode zum Erstellen von Apps und zur Datenaufnahme
Wie Sie eine App erstellen und Daten aufnehmen, hängt vom Datentyp ab:
Für Websitedaten können Sie entweder die Google Cloud Console oder die API verwenden. Wenn Sie mit der API erstellte Websitedaten verwenden möchten, müssen Sie sie in der Google Cloud Console an eine App anhängen, für die Unternehmensfunktionen aktiviert sind.
Für strukturierte oder unstrukturierte Daten können Sie entweder dieGoogle Cloud Console oder die API verwenden.
Für Gesundheitsdaten können Sie entweder die Google Cloud Console oder die API verwenden.
Dokumente
Jeder Datenspeicher enthält mindestens einen Datensatz, der als Dokument bezeichnet wird. Die Art des Dokuments hängt vom Datentyp im Datenspeicher ab:
Website Ein Dokument ist eine Webseite.
Strukturierte Daten: Ein Dokument ist eine Zeile in einer Tabelle oder ein JSON-Datensatz mit einem bestimmten Schema. Sie können dieses Schema selbst angeben oder Vertex AI Search das Schema aus den aufgenommenen Daten ableiten lassen.
Strukturierte Daten für Medien Ein Dokument ist eine Zeile in einer Tabelle oder ein JSON-Datensatz mit einem Schema, das für Media spezifisch ist. Die Dokumente sind Datensätze zu Medieninhalten wie Videos, Nachrichtenartikeln, Musikdateien und Podcasts. Ein Dokument enthält Informationen, die eine Mediendatei beschreiben, mindestens Titel, URI des Inhalts, Kategorien, Dauer und Verfügbarkeitsdatum.
Unstrukturierte Daten: Ein Dokument ist eine Datei in einem der folgenden Formate: TXT, PDF, HTML, DOCX, PPTX, XLSX und XLSM.
FHIR-Gesundheitsdaten Ein Dokument ist eine unterstützte FHIR R4-Ressource. Eine Liste der von Vertex AI Search unterstützten FHIR R4-Ressourcen finden Sie in der Referenz zum Datenschema für Healthcare FHIR R4.
Datenspeicher und Apps
In Vertex AI Search gibt es verschiedene Arten von Datenspeichern. Ein Datenspeicher kann jeweils nur einen Datentyp enthalten.
- Websitedaten
- Strukturierte Daten
- Strukturierte Inhalte (Medien)
- Unstrukturierte Daten
- FHIR-Gesundheitsdaten
Websitedaten
Für einen Datenspeicher mit Websitedaten werden Daten verwendet, die von öffentlichen Websites indexiert wurden. Sie können eine Reihe von URL-Mustern angeben, die in Ihren Datenspeicher aufgenommen werden sollen. Die Webseiten, die den URL-Mustern entsprechen, werden als eingeschlossene Webseiten bezeichnet. Anschließend können Sie die Suche in den Daten einrichten, die von den eingeschlossenen Webseiten gecrawlt wurden.
Sie können beispielsweise URL-Muster wie example.com/faq/* und example.com/events/* angeben und die Suche in den Daten aktivieren, die von diesen Webseiten gecrawlt wurden und dem Muster entsprechen. Diese Daten umfassen Text, mit Metadaten getaggte Bilder und andere strukturierte Daten wie meta-Tags, PageMap-Attribute und schema.org-Daten.
Sie können auch URL-Muster für Teile von Websites angeben, die ausgeschlossen werden sollen, z. B. example.com/events/members-only/* oder example.com/events/past-*. Ausgeschlossene URLs haben Vorrang vor eingeschlossenen URLs.
Es gibt zwei Arten von Datenspeichern für Websites:
Einfache Websuche:
- Bietet Suchfunktionen für den vorhandenen Google-Suchindex für die enthaltenen Websites.
- Die Domain muss nicht bestätigt werden.
Erweiterte Websiteindexierung:
- Bietet erweiterte Suchfunktionen für einen Index, der auf Grundlage einer der folgenden Quellen generiert wird:
- Die Inhaber von Vertex AI Search-Apps können steuern, welche Webseiten indexiert werden, indem sie Sitemaps einreichen und verwalten. Weitere Informationen So bleibt der Index ohne manuellen Eingriff aktuell.
- Die Inhaber von Vertex AI Search-Apps können eine erste Indexierung durchführen, die den Google-Suchindex widerspiegelt, und dann die Abdeckung des Index erweitern, indem sie die Websites bei Bedarf neu crawlen. So bleibt der Index immer aktuell. Weitere Informationen finden Sie unter Webseiten aktualisieren. Die erweiterten Funktionen der erweiterten Websiteindexierung sind unter Erweiterte Websiteindexierung aufgeführt.
- Erfordert, dass Inhaber von Vertex AI Search-Datenspeichern die Domains überprüfen, zu denen die enthaltenen Websites gehören. Weitere Informationen finden Sie unter Website-Domains bestätigen.
- Bietet die Möglichkeit, dem Datenspeicherschema strukturierte Daten hinzuzufügen.
Eine Website enthält unstrukturierte Daten. Sie können Ihren Webseiten jedoch strukturierte Daten in Form von
meta-Tags, PageMap-Attributen und Schema.org-Daten hinzufügen. Anschließend können Sie mit diesen strukturierten Daten das Schema des Datenspeichers bearbeiten, wie unter Strukturierte Daten für die erweiterte Website-Indexierung verwenden beschrieben.
- Bietet erweiterte Suchfunktionen für einen Index, der auf Grundlage einer der folgenden Quellen generiert wird:
Nächste Schritte
Für die Websitesuche:
- Informationen zu den Voraussetzungen für die Indexierung finden Sie unter Daten für die Website-Suche vorbereiten.
- Datenspeicher mit Websiteinhalten erstellen
- Suchanwendung erstellen
Strukturierte Daten
Ein Datenspeicher mit strukturierten Daten ermöglicht semantische Suchen oder Empfehlungen auf Basis strukturierter Daten. Sie können Daten entweder aus BigQuery oder Cloud Storage importieren. Über die API können Sie strukturierte JSON-Daten auch manuell hochladen.
Sie können beispielsweise für einen Produktkatalog Ihrer E-Commerce-Plattform oder ein Ärzteverzeichnis Such- oder Empfehlungsfunktionen aktivieren.
Vertex AI Search erkennt das Schema automatisch anhand der importierten Daten. Sie können optional auch ein Schema für Ihre Daten angeben. Dadurch wird die Qualität der Ergebnisse in der Regel verbessert.
Nächste Schritte
Für die benutzerdefinierte Suche:
- Strukturierte Daten für die Aufnahme vorbereiten
- Suchdatenspeicher mit einer der folgenden Methoden erstellen:
- Suchanwendung erstellen
So erhalten Sie personalisierte Empfehlungen:
- Benutzerdefinierten Datenspeicher für Empfehlungen erstellen
- Benutzerdefinierte Empfehlungs-App erstellen
Strukturierte Daten für Media
Medienanwendungen können nur mit Mediendatenspeichern verbunden werden. Medien-Datenspeicher sind Datenspeicher mit strukturierten Daten, die ein von Google definiertes Schema oder ein eigenes benutzerdefiniertes Schema mit einer bestimmten Gruppe von fünf mediabezogenen Feldern enthalten. Weitere Informationen zum Schema finden Sie unter Mediendokumente und Datenspeicher.
Sie können beispielsweise Empfehlungen aktivieren, indem Sie eine App für Medienempfehlungen für einen Filmkatalog oder eine Nachrichtenseite erstellen, damit Ihre Nutzer passende und personalisierte Vorschläge erhalten.
Neben Mediendokumenten enthalten Mediendatenspeicher auch die Nutzerereignisinformationen, mit denen Vertex AI Search Empfehlungen und Suchergebnisse für Ihre Nutzer anpassen kann. Nutzerereignisse sind für Media-Apps erforderlich. Informationen zu Nutzerereignissen finden Sie unter Echtzeit-Nutzerereignisse aufzeichnen.
Nächste Schritte
Unstrukturierte Daten
Ein Datenspeicher mit unstrukturierten Daten ermöglicht semantische Suchen auf Basis von Daten wie Dokumenten und Bildern.
Datenspeicher mit unstrukturierten Daten unterstützen Dokumente in den Formaten TXT, PDF, HTML, DOCX, PPTX, XLSX und XLSM.
Für Anfragen in natürlicher Sprache liefert die Suche Ergebnisse in Form von 10 URLs und zusammengefassten Antworten. Die Dokumente müssen mit den entsprechenden Zugriffsberechtigungen in einen Cloud Storage-Bucket hochgeladen werden. So kann beispielsweise ein Finanzinstitut für seinen privaten Korpus an Finanzpublikationen oder ein Biotech-Unternehmen für sein privates Archiv medizinischer Forschung Suchen oder Empfehlungen aktivieren.
Nächste Schritte
Für die Suche:
- Unstrukturierte Daten für die Aufnahme vorbereiten
- Suchdatenspeicher mit einer der folgenden Methoden erstellen:
- Suchdatenspeicher für Ihre unstrukturierten Daten erstellen
- Suchanwendung erstellen
FHIR-Gesundheitsdaten
Eine Healthcare-Suchanwendung verwendet FHIR R4-Daten, die aus einem FHIR-Speicher der Cloud Healthcare API importiert wurden. Eine Liste der FHIR R4-Ressourcen, die von Vertex AI Search unterstützt werden, finden Sie unter Referenz zum FHIR R4-Datenschema für Gesundheitsdaten. Ein FHIR R4-Datenspeicher muss einige Anforderungen erfüllen, bevor er als Datenquelle für den Vertex AI Search-Datenspeicher verwendet werden kann. Weitere Informationen finden Sie unter FHIR-Gesundheitsdaten für die Aufnahme vorbereiten.
Nächste Schritte
- FHIR R4-Daten für die Aufnahme vorbereiten
- Datenspeicher für die Suche im Gesundheitswesen erstellen
- Anwendung zur Suche nach Gesundheitsdaten erstellen
Zusammengeführte Suche
Sie können eine App für die zusammengeführte Suche erstellen, bei der mehrere Datenspeicher mit einer einzelnen benutzerdefinierten Such-App verbunden werden können. So können Sie mit einer App in mehreren Quellen und Datentypen suchen.
Wenn Sie eine App für die zusammengeführte Suche erstellen möchten, müssen Sie beim Erstellen einer neuen benutzerdefinierten Such-App mehrere Datenspeicher auswählen. Tun Sie dies nicht, können Sie später keine weiteren Datenspeicher hinzufügen.
Wenn Sie Suchergebnisse abrufen, können Sie entweder in allen Datenspeichern suchen oder nach Ergebnissen aus einem einzelnen Datenspeicher filtern.
Es gelten folgende Einschränkungen:
- Datenspeicher hinzufügen und entfernen:
- Wenn Sie für eine App die zusammengeführte Suche aktivieren möchten, müssen Sie beim Erstellen der App mindestens zwei Datenspeicher verbinden.
- Sie können einer App für die zusammengeführte Suche Datenspeicher hinzufügen oder daraus entfernen. Die App muss jedoch immer mit mindestens zwei Datenspeichern verbunden sein.
- Wenn Sie beim Erstellen einer Such-App nur einen Datenspeicher verbinden, können Sie weder weitere Datenspeicher hinzufügen noch diesen Datenspeicher entfernen.
- Für die Verwendung in zusammengeführten Suchvorgängen muss für Website-Datenspeicher die erweiterte Websiteindexierung aktiviert sein. Weitere Informationen finden Sie unter Erweiterte Websiteindexierung.
- Es werden keine Datenspeicher mit unstrukturierten Daten, die aus BigQuery importiert wurden, unterstützt.
- Die zusammengeführte Suche unterstützt für Suchanfragen die folgenden Felder:
boostSpeccontentSearchSpecdataStoreSpecsfacetSpecsfilterlanguageCodeoffsetoneBoxPageSizeorderByquerypageSizepageTokenrelevanceScoreSpecrelevanceThresholdsessionsessionSpecspellCorrectionSpecuserInfouserPseudoId
- Die zusammengeführte Suche unterstützt für
DataStoreSpecdie folgenden Felder:dataStoreboostSpec: Wenn sowohl fürSearchRequestals auchdataStoreSpecsBoost-Spezifikationen angegeben sind, werden beide auf die Suchergebnisse angewendet.filter: Wenn sowohl fürSearchRequestals auchdataStoreSpecsFilter angegeben sind, werden beide auf die Suchergebnisse angewendet.
- Bei Apps für die zusammengeführte Suche werden für Bereitstellungskonfigurationen CRUD-Vorgänge (Create, Read, Update, Delete) unterstützt. In einer Bereitstellungskonfiguration können nur die folgenden Felder hinzugefügt oder aktualisiert werden:
boostControlIdsdisplayNamefilterControlIdsgenericConfig:contentSearchSpec
namesolutionTypesynonymsControlIds
- Bei Apps für die zusammengeführte Suche werden für folgende Steuerelemente CRUD-Vorgänge unterstützt:
boostActionsynonymActionfilterAction
- Pro Such-App sind maximal 50 Datenspeicher zulässig.
- Wenn ein Datenspeicher eine Konfiguration mit kundenverwalteten Verschlüsselungsschlüsseln verwendet, müssen alle anderen Datenspeicher ebenfalls diese Konfiguration verwenden.