Datenpool verwalten
In diesem Dokument wird beschrieben, wie Sie Datenpools in BigQuery Sharing (früher Analytics Hub) verwalten. Als Administrator von BigQuery Sharing haben Sie folgende Möglichkeiten:
- Datenpools erstellen, aktualisieren, ansehen, freigeben und löschen
- Einträge erstellen, aktualisieren, löschen und freigeben
- Administratoren von BigQuery Sharing sowie Publisher, Abonnenten, Betrachter und Administratoren von Einträgen verwalten
Standardmäßig ist ein Datenpool privat. Nur Nutzer oder Gruppen mit Zugriff auf einen Datenpool können die zugehörigen Daten aufrufen oder abonnieren. Sie können beantragen, dass Ihr Datenpool öffentlich gemacht wird.
Wenn Sie Ihren Datenpool öffentlich machen, können Google Cloud -Nutzer (allAuthenticatedUsers) Einträge finden und abonnieren.
Hinweise
Damit Sie BigQuery Sharing (früher Analytics Hub) nutzen können, müssen Sie die Analytics Hub API in Ihrem Google Cloud -Projekt aktivieren.
Zum Aktivieren der Analytics Hub API benötigen Sie die folgenden IAM-Berechtigungen (Identity and Access Management):
serviceUsage.services.getserviceUsage.services.listserviceUsage.services.enable
Die folgende vordefinierte IAM-Rolle enthält die Berechtigungen, die Sie zum Aktivieren der Analytics Hub API benötigen:
- Service Usage Admin (
roles/serviceusage.serviceUsageAdmin)
Wählen Sie eine der folgenden Optionen aus, um die Analytics Hub API zu aktivieren:
Console
Rufen Sie die Seite Analytics Hub API auf und aktivieren Sie die Analytics Hub API für Ihr Google Cloud Projekt.
gcloud
Führen Sie den Befehl gcloud services enable aus:
gcloud services enable analyticshub.googleapis.com
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Analytics Hub Administrator (roles/analyticshub.admin) für Ihr Projekt zuzuweisen, damit Sie die Berechtigungen erhalten, die Sie zum Verwalten von Datenpools benötigen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Datenpool erstellen
So erstellen Sie einen Datenpool:
Console
Rufen Sie die Seite Sharing (Analytics Hub) auf.
Klicken Sie auf Datenpool erstellen.
Wählen Sie im Dialogfeld Datenpool erstellen ein Projekt und eine Region für den Datenpool aus. Sie können das Projekt und die Region nicht aktualisieren, nachdem Sie den Datenpool erstellt haben.
Geben Sie im Feld Anzeigename einen Namen für den Datenpool ein.
Optional: Geben Sie Werte in die folgenden Felder ein:
- Primärer Kontakt: Geben Sie die URL oder die E-Mail-Adresse des primären Kontakts für den Datenpool ein.
- Beschreibung: Geben Sie eine Beschreibung für den Datenpool ein.
Wenn Sie die Prinzipal-IDs aller Nutzer protokollieren möchten, die Jobs und Abfragen für verknüpfte Datasets ausführen, klicken Sie auf den Ein/Aus-Button Logging der E‑Mail-Adressen von Abonnenten. Wenn Sie diese Option aktivieren, ist das Logging von Abonnenten-E‑Mails für alle zukünftigen Einträge im Datenpool aktiviert. Die protokollierten Daten sind im Feld
job_principal_subjectderINFORMATION_SCHEMA.SHARED_DATASET_USAGE-Ansicht verfügbar.Klicken Sie auf den Ein/Aus-Button Öffentliche Sichtbarkeit, um die öffentliche Sichtbarkeit zu aktivieren. Wenn ein Datenpool öffentlich sichtbar ist, erscheinen alle Einträge im Datenpool und sind im Katalog suchbar. Wenn Sie die öffentliche Sichtbarkeit aktivieren, müssen Sie die Berechtigungen des Datenpools konfigurieren. Alle Einträge übernehmen standardmäßig die Einstellung für die öffentliche Sichtbarkeit des Datenpools. Aufgrund der Übernahme von Einstellungen können öffentliche Datenpools keine privaten Einträge haben, private Datenpools können jedoch öffentliche Einträge haben. Sie können den Typ der öffentlichen Sichtbarkeit auf der Ebene einzelner Einträge festlegen. Das Projekt, in dem Sie den Datenpool erstellen, muss eine Organisation und ein Rechnungskonto haben.
Klicken Sie auf Datenpool erstellen.
Optional: Führen Sie im Abschnitt Datenpool-Berechtigungen die folgenden Schritte aus:
Geben Sie die E-Mail-Adressen in die folgenden Felder ein, um die IAM-Rollen (Identity and Access Management) zuzuweisen:
- Administratoren: Weisen Sie diesen Nutzern die Rolle „Analytics Hub Administrator“ (
roles/analyticshub.admin) zu. - Publisher: Weisen Sie diesen Nutzern die Rolle „Analytics Hub Publisher“ (
roles/analyticshub.publisher) zu. Informationen zu den Aufgaben, die Publisher von BigQuery Sharing ausführen können, finden Sie unter Einträge verwalten. - Abonnenten: Weisen Sie diesen Nutzern die Rolle „Analytics Hub Subscriber“ (
roles/analyticshub.subscriber) zu. Informationen zu den Aufgaben, die Abonnenten von BigQuery Sharing ausführen können, finden Sie unter Einträge und Datenpools ansehen und abonnieren. Betrachter: Weisen Sie diesen Nutzern die Rolle „Analytics Hub Viewer“ (
roles/analyticshub.viewer) zu. BigQuery Sharing-Betrachter können Einträge ansehen.Wenn die öffentliche Sichtbarkeit aktiviert ist, weisen Sie
allUsersoderallAuthenticatedUsersdie Rolle „Analytics Hub Viewer“ zu.
- Administratoren: Weisen Sie diesen Nutzern die Rolle „Analytics Hub Administrator“ (
Klicken Sie zum Speichern von Berechtigungen auf Berechtigungen festlegen.
Wenn Sie keine Berechtigungen für den Datenpool festgelegt haben, klicken Sie auf Überspringen.
API
Verwenden Sie die Methode projects.locations.dataExchanges.create:
POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/location/LOCATION/dataExchanges?dataExchangeId=DATAEXCHANGE_ID
Ersetzen Sie Folgendes:
PROJECT_ID: Die ID des Projekts, in dem Sie den Datenpool erstellen möchten.LOCATION: Der Standort für Ihren Datenpool. Weitere Informationen zu Standorten, die BigQuery Sharing unterstützen, finden Sie unter Unterstützte Regionen.DATAEXCHANGE_ID: die ID für Ihren Datenpool.
Geben Sie im Anfragetext die Details zum Datenpool an.
Wenn die Anfrage erfolgreich ist, enthält der Antworttext die Details zum Datenpool.
Wenn Sie das Logging von Abonnenten-E‑Mails mit dem Feld logLinkedDatasetQueryUserEmail aktivieren, enthält die Datenpoolantwort log_linked_dataset_query_user_email: true. Die protokollierten Daten sind im Feld job_principal_subject der INFORMATION_SCHEMA.SHARED_DATASET_USAGE-Ansicht verfügbar.
Weitere Informationen zu den Aufgaben, die Sie für Datenpools anhand von APIs ausführen können, finden Sie unter projects.locations.dataExchanges-Methoden.
Datenpool aktualisieren
So aktualisieren Sie einen Datenpool:
Console
Rufen Sie die Seite Sharing (Analytics Hub) auf.
Wählen Sie in der Liste den Datenpool aus, den Sie aktualisieren möchten.
Wechseln Sie zum Tab Details.
Klicken Sie auf Datenpool bearbeiten.
Aktualisieren Sie im Dialogfeld Datenpool bearbeiten die folgenden Felder:
- Anzeigename
- Primärer Kontakt
- Beschreibung
- Öffentliche Sichtbarkeit
- Wenn Sie die öffentliche Sichtbarkeit aktivieren, weisen Sie
allUsersoderallAuthenticatedUsersdie Rolle „Analytics Hub Viewer“ (roles/analyticshub.viewer) zu. - Wenn Sie die öffentliche Sichtbarkeit deaktivieren, entfernen Sie die Rolle „Analytics Hub Viewer“ (
roles/analyticshub.viewer) ausallUsersoderallAuthenticatedUsers. Öffentliche Datenpools können keine privaten Einträge haben, private Datenpools können jedoch öffentliche Einträge haben.
- Wenn Sie die öffentliche Sichtbarkeit aktivieren, weisen Sie
Logging der E‑Mail-Adressen von Abonnenten
Klicken Sie auf Speichern.
API
Verwenden Sie die Methode projects.locations.dataExchanges.patch:
PATCH https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/location/LOCATION/dataExchanges/DATAEXCHANGE_ID?updateMask=UPDATEMASK
Ersetzen Sie UPDATEMASK durch die Liste der Felder, die Sie aktualisieren möchten. Verwenden Sie zum Aktualisieren mehrerer Werte eine durch Kommas getrennte Liste. Geben Sie beispielsweise displayName,primaryContact ein, um den Anzeigenamen und den primären Kontakt für einen Datenpool zu aktualisieren.
Geben Sie im Anfragetext aktualisierte Werte für die folgenden Felder an:
displayNamedescriptionprimaryContactdocumentationicondiscoveryTypelogLinkedDatasetQueryUserEmail
Weitere Informationen zu diesen Feldern finden Sie unter Ressource: DataExchange.
Weitere Informationen zu den Aufgaben, die Sie für Datenpools anhand von APIs ausführen können, finden Sie unter projects.locations.dataExchanges-Methoden.
Datenpools ansehen
So rufen Sie Datenpools in Projekten oder Organisationen auf, auf die Sie Zugriff haben:
Console
Rufen Sie die Seite Sharing (Analytics Hub) auf.
Auf der Seite werden die Datenpools in Ihrem Google Cloud -Projekt angezeigt. Wenn Sie die Berechtigung
resourcemanager.organizations.gethaben, können Sie auch den Datenpool in Ihrer Google Cloud -Organisation sehen.
API
Verwenden Sie die Methode projects.locations.dataExchanges.list, um Datenpools in Ihrem Projekt aufzurufen:
GET https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/location/LOCATION/dataExchanges
Ersetzen Sie Folgendes:
- PROJECT_ID: Projekt-ID.
- LOCATION: der Standort, für den Sie die vorhandenen Datenpools auflisten möchten.
Verwenden Sie die Methode organizations.locations.dataExchanges.list, um Datenpools in Ihrer Organisation aufzurufen:
GET https://analyticshub.googleapis.com/v1/organizations/ORGANIZATION_ID/location/LOCATION/dataExchanges
Ersetzen Sie Folgendes:
ORGANIZATION_ID: die Organisations-ID. Weitere Informationen finden Sie unter Organisations-ID abrufen.LOCATION: der Standort, für den Sie die vorhandenen Datenpools auflisten möchten.
Datenpools freigeben
Wenn der BigQuery Sharing-Publisher zu einer anderen Organisation gehört als die Organisation, die den Datenpool enthält, kann der Publisher Ihren Datenpool in BigQuery Sharing nicht aufrufen. Geben Sie dem Publisher einen Link zum Datenpool weiter.
Rufen Sie die Seite Sharing (Analytics Hub) auf.
Klicken Sie in der Liste der Datenpools auf Weitere Optionen.
Klicken Sie auf Link zur Freigabe kopieren.
Nutzern Zugriff auf einen Datenpool gewähren
Damit Nutzer auf einen Datenpool zugreifen können, müssen Sie die IAM-Richtlinie für diesen Datenpool festlegen. Informationen zu vordefinierten IAM-Nutzerrollen finden Sie unter IAM-Rollen für BigQuery Sharing.
Console
Rufen Sie in der Google Cloud -Console die Seite Sharing (Analytics Hub) auf.
Klicken Sie auf den Namen des Datenpools, für den Sie Berechtigungen festlegen möchten.
Wechseln Sie zum Tab Details.
Klicken Sie auf Berechtigungen festlegen.
Klicken Sie zum Hinzufügen von Prinzipalen auf Prinzipale hinzufügen.
Fügen Sie im Feld Neue Prinzipale die E-Mail-Adressen hinzu, für die Sie den Zugriff gewähren möchten. Sie können auch
allUsersverwenden, um eine Ressource öffentlich und für alle im Internet zugänglich zu machen, oderallAuthenticatedUsers, um sie nur für angemeldete Google-Nutzer zugänglich zu machen.Wählen Sie im Menü Rolle auswählen die Option Analytics Hub und dann eine der folgenden IAM-Rollen (Identity and Access Management) aus:
- Analytics Hub Admin
- Analytics Hub Listing Admin
- Analytics Hub Publisher
- Analytics Hub Subscriber
- Analytics Hub Subscription Owner
- Analytics Hub Viewer
Klicken Sie auf Speichern.
API
Lesen Sie die vorhandene Richtlinie mit der Eintragsmethode
getIamPolicy. Verwenden Sie dazu die Methodeprojects.locations.dataExchanges.getIamPolicy:POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/DATAEXCHANGE_ID:getIamPolicy
Dabei gilt:
PROJECT_ID: die Projekt-ID, z. B.my-project-1.LOCATION: der Standort für Ihren Datenpool. Verwenden Sie Kleinbuchstaben.DATAEXCHANGE_ID: die Datenpool-ID.
BigQuery Sharing (früher Analytics Hub) gibt die aktuelle Richtlinie zurück.
Bearbeiten Sie die Richtlinie mit einem Texteditor, um Mitglieder und ihre zugehörigen IAM-Rollen (Identity and Access Management) hinzuzufügen oder zu entfernen. Verwenden Sie das folgende Format, um Mitglieder hinzuzufügen:
user:test-user@gmail.comgroup:admins@example.comserviceAccount:test123@example.domain.comdomain:example.domain.com
Fügen Sie der Richtlinie beispielsweise die folgende Bindung hinzu, um
group:subscribers@example.comdie Rolleroles/analyticshub.subscriberzuzuweisen:{ "members": [ "group:subscribers@example.com" ], "role":"roles/analyticshub.subscriber" }Verwenden Sie die Methode
projects.locations.dataExchanges.setIamPolicy, um die aktualisierte Richtlinie zu schreiben. Geben Sie im Anfragetext die aktualisierte IAM-Richtlinie aus dem vorherigen Schritt an.POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/DATAEXCHANGE_ID:setIamPolicy
Geben Sie im Anfragetext die Eintragsdetails an. Wenn die Anfrage erfolgreich ist, enthält der Antworttext Details zum Eintrag.
BigQuery Sharing-Administratoren erstellen
Zum Verwalten von Datenpools müssen Sie Datenpooladministratoren erstellen, indem Sie Nutzern auf Projekt- oder Datenpoolebene die Rolle „Analytics Hub Administrator“ (roles/analyticshub.admin) zuweisen.
Wenn Sie möchten, dass Administratoren alle Datenpools in einem Projekt verwalten, weisen Sie ihnen die Rolle „Analytics Hub Administrator” für dieses Projekt zu.
Wenn Sie möchten, dass Administratoren einen bestimmten Datenpool verwalten, weisen Sie ihnen die Rolle „Analytics Hub Administrator” für diesen Datenpool zu.
Datenpool öffentlich machen
Standardmäßig ist ein Datenpool privat. Nur Nutzer oder Gruppen mit Zugriff auf einen Datenpool können die Einträge aufrufen oder abonnieren. Sie können einen Datenpool öffentlich machen. Dann können Google Cloud -Nutzer (allAuthenticatedUsers) die Einträge des Datenpools finden und abonnieren.
So machen Sie einen Datenpool öffentlich:
Damit
allAuthenticatedUsersEinträge ansehen kann, weisen Sie ihm auf Datenpoolebene die Rolle „Analytics Hub Viewer“ (roles/analyticshub.viewer) zu.Damit
allAuthenticatedUsersEinträge abonnieren kann, weisen Sie ihm auf Datenpoolebene die Rolle „Analytics Hub Subscriber“ (roles/analyticshub.subscriber) zu.Aktivieren Sie die öffentliche Sichtbarkeit, wenn Sie einen Datenpool erstellen oder aktualisieren. Geben Sie die entsprechenden Berechtigungen an, wenn Sie einen Datenpool öffentlich machen.
Datenpool löschen
Wenn Sie einen Datenpool löschen, werden auch alle zugehörigen Einträge gelöscht. Freigegebene und verknüpfte Datasets werden jedoch nicht gelöscht. Wenn Sie ein Projekt löschen, werden die zugehörigen Datenpools nicht gelöscht. Löschen Sie diese Datenpools, bevor Sie das Projekt löschen. Das Löschen eines Datenpools kann nicht rückgängig gemacht werden.
Bevor Sie einen Datenpool löschen, führen Sie die folgenden Schritte aus, die von der Konfiguration des Datenpools abhängen:
- Für Datenpools mit kommerziellen Einträgen, die in den Google Cloud Marketplace eingebunden sind, deaktivieren Sie die eingebundenen Einträge.
- Bei Datenpools mit Einträgen für mehrere Regionen entfernen Sie alle aktiven Abos mit der Methode
projects.locations.subscriptions.revoke.
So löschen Sie einen Datenpool:
Console
Rufen Sie die Seite Sharing (Analytics Hub) auf.
Wählen Sie in der Liste den Datenpool aus, den Sie löschen möchten.
Wechseln Sie zum Tab Details.
Klicken Sie auf Datenpool löschen.
Bestätigen Sie im Dialogfeld Datenpool löschen? den Löschvorgang, indem Sie Löschen eingeben.
Klicken Sie auf Löschen.
API
Verwenden Sie die Methode projects.locations.dataExchanges.delete:
DELETE https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/DATAEXCHANGE_ID
Ersetzen Sie Folgendes:
PROJECT_ID: Die ID des Projekts, in dem Sie den Datenpool erstellen möchten.LOCATION: Der Standort für Ihren Datenpool. Weitere Informationen zu Standorten, die BigQuery Sharing unterstützen, finden Sie unter Unterstützte Regionen.DATAEXCHANGE_ID: die ID für Ihren Datenpool.
Weitere Informationen zu den Aufgaben, die Sie für den Datenpool anhand von APIs ausführen können, finden Sie unter projects.locations.dataExchanges-Methoden.
Nächste Schritte
- Einträge verwalten
- Analytics Hub-Nutzerrollen zuweisen
- Informationen zum Aufrufen und Abonnieren von Einträgen und Datenpools
- Weitere Informationen zur Freigaben von Audit-Logs