Auf dieser Seite wird erklärt, wie Sie einen Datenspeicher für Medien erstellen und Daten in ihn importieren.
Hinweis
Achten Sie darauf, dass Sie Folgendes tun:
Sehen Sie sich die Konzepte zu Mediendaten und -schemas an:
Entscheiden Sie, ob Sie das vordefinierte Google-Schema für Ihre Medien daten oder Ihr eigenes Schema verwenden.
Wenn Sie Ihr eigenes Schema verwenden, muss es Felder enthalten, die gut den Media-Properties für das benutzerdefinierte Schema zugeordnet werden können, z. B.
title,url,category.Fügen Sie Ihre Mediendokumente in das JSON-Schema ein und laden Sie die Daten in BigQuery oder Cloud Storage hoch.
Lesen Sie den Artikel Nutzerereignisse für Medien und bereiten Sie Ihre Nutzerereignisse für den Import vor. Nutzerereignisse sind für alle Media-Apps erforderlich.
Verfahren entsprechend Ihrer Datenquelle auswählen
Wenn Sie einen Datenspeicher für Medien erstellen und Dokumente importieren möchten, rufen Sie den Abschnitt für die gewünschte Quelle auf:
Aus BigQuery importieren
Console
So erstellen Sie über die Google Cloud Console einen Datenspeicher für Medien und importieren Dokumente und Nutzerereignisse aus BigQuery:
Rufen Sie in der Google Cloud Console die Seite KI-Anwendungen auf.
Rufen Sie die Seite Datenspeicher auf.
Klicken Sie auf Datenspeicher erstellen.
Wählen Sie auf der Seite Quelle die Option BigQuery aus.
Wählen Sie Medien – BigQuery-Tabelle mit strukturierten Mediendaten als Art der zu importierenden Daten aus.
Klicken Sie im Feld BigQuery-Pfad auf Durchsuchen, wählen Sie die BigQuery-Daten aus, die Sie für die Aufnahme vorbereitet haben, und klicken Sie dann auf Auswählen. Alternativ können Sie den Speicherort direkt in das Feld BigQuery-Pfad eingeben.
Wenn sich Ihre Daten im vordefinierten Google-Schema befinden, wählen Sie Vordefiniertes Google Schema aus, klicken Sie auf Weiter und fahren Sie mit Schritt 11 fort.
Wenn sich Ihre Daten in Ihrem eigenen Schema befinden, wählen Sie Benutzerdefiniertes Schema aus und klicken Sie auf Weiter.
Überprüfen Sie das erkannte Schema und weisen Sie den Schemafeldern über das Menü Schlüsselattribute Attribute zu.
Klicken Sie auf Weiter.
Sie können erst fortfahren, wenn die erforderlichen Schlüsselattribute zugeordnet sind. Dies wird durch grüne Häkchen anstelle von orangefarbenen Warnzeichen angezeigt.
Geben Sie einen Namen für den Datenspeicher ein und klicken Sie auf Erstellen.
Aus Cloud Storage importieren
Console
So erstellen Sie einen Datenspeicher für Medien über die Google Cloud Console und importieren Dokumente aus Cloud Storage:
Rufen Sie in der Google Cloud Console die Seite KI-Anwendungen auf.
Rufen Sie die Seite Datenspeicher auf.
Klicken Sie auf Datenspeicher erstellen.
Wählen Sie auf der Seite Quelle die Option Cloud Storage aus.
Wählen Sie Strukturierte Mediendaten (JSONL mit Mediendateien) als Art der zu importierenden Daten aus.
Wählen Sie im Bereich Ordner oder Datei für Import auswählen die Option Ordner oder Datei aus.
Klicken Sie auf Durchsuchen , wählen Sie die Daten aus, die Sie für die Aufnahme vorbereitet haben, und klicken Sie dann auf Auswählen. Alternativ können Sie den Speicherort direkt in das Feld
gs://eingeben.Wenn sich Ihre Daten im vordefinierten Google-Schema befinden, wählen Sie Vordefiniertes Google Schema aus, klicken Sie auf Weiter und fahren Sie mit Schritt 11 fort.
Wenn sich Ihre Daten in Ihrem eigenen Schema befinden, wählen Sie Benutzerdefiniertes Schema aus und klicken Sie auf Weiter.
Überprüfen Sie das erkannte Schema und weisen Sie den Schemafeldern über das Menü Schlüsselattribute Attribute zu.
Klicken Sie auf Weiter.
Sie können erst fortfahren, wenn die erforderlichen Schlüsselattribute zugeordnet sind. Dies wird durch grüne Häkchen anstelle von orangefarbenen Warnzeichen angezeigt.
Geben Sie einen Namen für den Datenspeicher ein und klicken Sie auf Erstellen.
Dokumente mit der API importieren
Wenn Sie das vordefinierte Google-Schema verwenden, können Sie Ihre Dokumente
importieren, indem Sie eine POST Anfrage an die
Documents:import REST-Methode senden und das
InlineSource Objekt verwenden, um Ihre Daten anzugeben.
Ein Beispiel für das JSON-Dokumentformat finden Sie unter JSON-Dokumentformat.
Anforderungen an den Import
Die folgenden Anforderungen gelten für den Import von Mediendokumenten mit der API:
Jedes Dokument muss in einer eigenen Zeile stehen.
Die maximale Anzahl von Dokumenten in einem einzelnen Import beträgt 100.
Prozedur
So importieren Sie Mediendokumente mit der API:
Erstellen Sie einen Datenspeicher.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \ -d '{ "displayName": "DATA_STORE_DISPLAY_NAME", "industryVertical": "MEDIA" }'Ersetzen Sie Folgendes:
PROJECT_ID: die ID Ihres Google Cloud Projekts.DATA_STORE_ID: die ID des Datenspeichers für die Agent Search, den Sie erstellen möchten. Diese ID darf nur Kleinbuchstaben, Ziffern, Unterstriche und Bindestriche enthalten.DATA_STORE_DISPLAY_NAME: der Anzeigename des Datenspeichers für die Agent Search, den Sie erstellen möchten.
Erstellen Sie die JSON-Datei für Ihr Dokument und nennen Sie sie
./data.json:{ "inlineSource": { "documents": [ { DOCUMENT_1 }, { DOCUMENT_2 } ] } }Rufen Sie die Methode POST auf:
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data @./data.json \ "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/dataStores/DATA_STORE_ID/branches/0/documents:import"
Ersetzen Sie Folgendes:
PROJECT_ID: die ID Ihres Projekts.DATA_STORE_ID: die ID Ihres Datenspeichers.
JSON-Dokumentformat
Die folgenden Beispiele zeigen Document-Einträge im JSON-Format.
Geben Sie ein ganzes Dokument in einer einzigen Zeile an. Jedes Dokument sollte in einer eigenen Zeile stehen.
Pflichtfelder:
{ "id": "sample-01", "schemaId": "default_schema", "jsonData": "{\"title\":\"Test document title\",\"categories\":[\"sports > clip\",\"sports > highlight\"],\"uri\":\"http://www.example.com\",\"media_type\":\"sports-game\",\"available_time\":\"2022-08-26T23:00:17Z\"}" }
Vollständiges Objekt:
{ "id": "child-sample-0", "schemaId": "default_schema", "jsonData": "{\"title\":\"Test document title\",\"description\":\"Test document description\",\"language_code\":\"en-US\",\"categories\":[\"sports > clip\",\"sports > highlight\"],\"uri\":\"http://www.example.com\",\"images\":[{\"uri\":\"http://example.com/img1\",\"name\":\"image_1\"}],\"media_type\":\"sports-game\",\"in_languages\":[\"en-US\"],\"country_of_origin\":\"US\",\"content_index\":0,\"persons\":[{\"name\":\"sports person\",\"role\":\"player\",\"rank\":0,\"uri\":\"http://example.com/person\"},],\"organizations \":[{\"name\":\"sports team\",\"role\":\"team\",\"rank\":0,\"uri\":\"http://example.com/team\"},],\"hash_tags\":[\"tag1\"],\"filter_tags\":[\"filter_tag\"],\"production_year\":1900,\"duration\":\"100s\",\"content_rating\":[\"PG-13\"],\"aggregate_ratings\":[{\"rating_source\":\"imdb\",\"rating_score\":4.5,\"rating_count\":1250}],\"available_time\":\"2022-08-26T23:00:17Z\"}" }
Import überwachen und Daten ansehen
Wenn Sie den Status der Aufnahme überprüfen möchten, rufen Sie die Seite Datenspeicher auf und klicken Sie auf den Namen Ihres Datenspeichers. Dadurch werden die Details auf der Seite Daten angezeigt.
Klicken Sie auf den Tab Aktivität.
Wenn sich die Statusspalte auf dem Aktivität Tab von In Bearbeitung zu Import abgeschlossen ändert, ist die Aufnahme abgeschlossen.
Je nach Größe der Daten kann die Datenaufnahme einige Minuten oder mehrere Stunden dauern.
Klicken Sie auf Dokumente , um die importierten Daten anzusehen.
Nutzerereignisse importieren
So importieren Sie Nutzerereignisse in Ihren Datenspeicher für Medien:
- Folgen Sie der Anleitung unter Vergangene Nutzerereignisse importieren.
Nächste Schritte
Erstellen Sie eine Empfehlungs-App für Medien oder eine Such-App für Medien.
Halten Sie Ihre Dokumentdaten auf dem neuesten Stand.
Idealerweise sollten Sie Ihren Datenspeicher täglich aktualisieren, indem Sie neue Daten importieren. Durch die Planung regelmäßiger Importe wird verhindert, dass die Modellqualität im Laufe der Zeit sinkt. Sie können für die Automatisierung von Importen den Google Cloud Scheduler verwenden.
Sie können nur neue oder geänderte Dokumente aktualisieren oder den gesamten Datenspeicher importieren. Wenn Sie Dokumente importieren, die sich bereits in Ihrem Datenspeicher befinden, werden sie nicht noch einmal hinzugefügt. Jedes geänderte Dokument wird aktualisiert.
Halten Sie Ihre Nutzerereignisdaten auf dem neuesten Stand.
Es ist besonders wichtig, dass Sie Ihre Nutzerereignisse auf dem neuesten Stand halten. Die Empfehlungs-App funktioniert nicht mehr, wenn nicht genügend aktuelle Nutzerereignisse vorhanden sind, um die Datenanforderungen zu erfüllen.
Informationen zum Importieren von Nutzerereignisdaten in Echtzeit finden Sie unter Nutzerereignisse in Echtzeit aufzeichnen.
Informationen zum Monitoring der Anforderungen an Nutzerereignisse finden Sie unter Datenqualität für Medienempfehlungen prüfen.