Entitätsauflösung in BigQuery konfigurieren und verwenden
In diesem Dokument wird gezeigt, wie die Entitätsauflösung von Endnutzern (im Folgenden als Endnutzer bezeichnet) und Identitätsanbietern implementiert wird.
Endnutzer können dieses Dokument verwenden, um eine Verbindung zu einem Identitätsanbieter herzustellen und den Dienst des Anbieters zum Abgleichen von Datensätzen zu nutzen. Identitätsanbieter können dieses Dokument verwenden, um Dienste einzurichten und zu konfigurieren, die sie für Endnutzer auf Google Cloud Marketplace freigeben möchten.
Workflow für Endnutzer
In den folgenden Abschnitten wird beschrieben, wie Endnutzer die Entitätsauflösung in BigQuery konfigurieren. Eine visuelle Darstellung der vollständigen Einrichtung finden Sie unter Architektur für die Entitätsauflösung.
Hinweise
- Nehmen Sie Kontakt zu einem Identitätsanbieter auf und bauen Sie eine Beziehung zu ihm auf. BigQuery unterstützt die Entitätsauflösung mit LiveRamp.
- Erhalten Sie die folgenden Elemente vom Identitätsanbieter:
- Dienstkonto-Anmeldedaten
- Signatur der Remote-Funktion
- Erstellen Sie zwei Datasets in Ihrem Projekt:
- Eingabe-Dataset
- Ausgabe-Dataset
Erforderliche Rollen
Um die Berechtigungen zu erhalten, die Sie zum Ausführen von Entitätsauflösungsjobs benötigen, bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zu gewähren:
-
Gehen Sie so vor, damit das Dienstkonto des Identitätsanbieters das Eingabe-Dataset lesen und in das Ausgabe-Dataset schreiben kann:
-
BigQuery Data Viewer (
roles/bigquery.dataViewer
) für das Eingabe-Dataset -
BigQuery Data Editor (
roles/bigquery.dataEditor
) für das Ausgabe-Dataset
-
BigQuery Data Viewer (
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Entitäten übersetzen oder auflösen
Eine spezifische Anleitung für Identitätsanbieter finden Sie in den folgenden Abschnitten.
LiveRamp
Vorbereitung
- Konfigurieren Sie LiveRamp Embedded Identity in BigQuery. Weitere Informationen finden Sie unter LiveRamp Embedded Identity in BigQuery aktivieren.
- Stimmen Sie sich mit LiveRamp ab, um die API-Anmeldedaten für die Verwendung mit Embedded Identity zu aktivieren. Weitere Informationen finden Sie unter Authentifizierung.
Einrichtung
Die folgenden Schritte sind erforderlich, wenn Sie LiveRamp Embedded Identity zum ersten Mal verwenden. Nach Abschluss der Einrichtung müssen nur die Eingabetabelle und die Metadatentabelle zwischen den Ausführungen geändert werden.
Eingabetabelle erstellen
Erstellen Sie eine Tabelle im Eingabe-Dataset. Füllen Sie die Tabelle mit RampIDs, Zieldomains und Zieltypen. Weitere Informationen und Beispiele finden Sie unter Spalten und Beschreibungen in Eingabetabellen.
Metadatentabelle erstellen
Die Metadatentabelle wird verwendet, um die Ausführung von LiveRamp Embedded Identity in BigQuery zu steuern. Erstellen Sie eine Metadatentabelle im Eingabe-Dataset. Füllen Sie die Metadatentabelle mit Client-IDs, Ausführungsmodi, Zieldomains und Zieltypen. Weitere Informationen und Beispiele finden Sie unter Spalten und Beschreibungen in Metadatentabellen.
Tabellen für LiveRamp freigeben
Gewähren Sie dem LiveRamp-Dienstkonto Google Cloud die Berechtigung, Daten in Ihrem Eingabe-Dataset aufzurufen und zu verarbeiten. Weitere Informationen und Beispiele finden Sie unter Tabellen und Datasets für LiveRamp freigeben.
Eingebetteten Identitätsjob ausführen
So führen Sie einen eingebetteten Identitätsjob mit LiveRamp in BigQuery aus:
- Prüfen Sie, ob alle RampIDs, die in Ihrer Domain codiert wurden, in Ihrer Eingabetabelle enthalten sind.
- Prüfen Sie vor dem Ausführen des Jobs, ob die Metadatentabelle korrekt ist.
- Wenden Sie sich an LiveRampIdentitySupport@liveramp.com mit einer Jobverarbeitungsanfrage. Geben Sie dabei die Projekt-ID, die Dataset-ID und die Tabellen-ID (falls zutreffend) für die Eingabetabelle, die Metadatentabelle und das Ausgabe-Dataset an. Weitere Informationen finden Sie unter LiveRamp bitten, die Transcodierung zu starten.
Die Ergebnisse werden im Allgemeinen innerhalb von 3 Arbeitstagen an Ihr Ausgabe-Dataset gesendet.
LiveRamp-Unterstützung
Bei Problemen wenden Sie sich bitte an den LiveRamp Identity-Support.
LiveRamp-Abrechnung
LiveRamp übernimmt die Abrechnung für die Entitätsauflösung.
Workflow für Identitätsanbieter
In den folgenden Abschnitten wird beschrieben, wie Identitätsanbieter die Entitätsauflösung in BigQuery konfigurieren. Eine visuelle Darstellung der vollständigen Einrichtung finden Sie unter Architektur für die Entitätsauflösung.
Hinweise
- Erstellen Sie einen Cloud Run-Job oder eine Cloud Run-Funktion, um sie in die Remote-Funktion einzubinden. Beide Optionen sind für diesen Zweck geeignet.
Notieren Sie sich den Namen des Dienstkontos, das mit dem Cloud Run-Dienst oder der Cloud Run-Funktion verknüpft ist:
Wechseln Sie in der Google Cloud Console zur Seite Cloud Functions.
Klicken Sie auf den Namen der Funktion und dann auf den Tab Details.
Suchen Sie im Bereich Allgemeine Informationen nach dem Namen des Dienstkontos für die Remotefunktion und notieren Sie ihn.
Erstellen Sie eine Remote-Funktion.
Erfassen Sie die Hauptkonten des Endnutzers.
Erforderliche Rollen
Um die Berechtigungen zu erhalten, die Sie zum Ausführen von Entitätsauflösungsjobs benötigen, bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen zu gewähren:
-
Für das Dienstkonto, das mit Ihrer Funktion verknüpft ist, um auf verknüpften Datasets zu lesen und zu schreiben und Aufträge zu starten:
-
BigQuery-Datenbearbeiter (
roles/bigquery.dataEditor
) für das Projekt -
BigQuery-Jobnutzer (
roles/bigquery.jobUser
) für das Projekt
-
BigQuery-Datenbearbeiter (
-
Damit das Endnutzer-Prinzip die Remote-Funktion sehen und eine Verbindung zu ihr herstellen kann:
-
BigQuery-Verbindungsnutzer (
roles/bigquery.connectionUser
) für die Verbindung -
BigQuery Data Viewer (
roles/bigquery.dataViewer
) für das Dataset der Steuerungsebene mit der Remote-Funktion
-
BigQuery-Verbindungsnutzer (
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Remote-Funktion für die Entitätsauflösung freigeben
Ändern Sie den folgenden Remote-Schnittstellencode und geben Sie ihn an den Endnutzer weiter. Endnutzer benötigt diesen Code, um den Entitätsauflösungsjob zu starten.
`PARTNER_PROJECT_ID.DATASET_ID`.match`(LIST_OF_PARAMETERS)
Ersetzen Sie LIST_OF_PARAMETERS durch die Liste der Parameter, die an die Remote-Funktion übergeben werden.
Optional: Jobmetadaten angeben
Optional können Sie Job-Metadaten über eine separate Remote-Funktion oder durch Schreiben einer neuen Statustabelle in das Ausgabedataset des Nutzers bereitstellen. Beispiele für Metadaten sind Jobstatus und ‑messwerte.
Abrechnung für Identitätsanbieter
Um die Abrechnung und das Onboarding von Kunden zu optimieren, empfehlen wir die Integration Ihres Dienstes zur Entitätsauflösung mit dem Google Cloud Marketplace. So können Sie ein Abrechnungsmodell basierend auf der Nutzung des Entity Resolution-Jobs einrichten. Die Abrechnung erfolgt dann über Google. Weitere Informationen finden Sie unter SaaS-Produkte (Software as a Service) anbieten.