Datenpool verwalten

In diesem Dokument wird beschrieben, wie Sie Datenpools in BigQuery Sharing (früher Analytics Hub) verwalten. Als Administrator von BigQuery Sharing haben Sie folgende Möglichkeiten:

  • Datenpools erstellen, aktualisieren, ansehen, freigeben und löschen
  • Einträge erstellen, aktualisieren, löschen und freigeben
  • Administratoren von BigQuery Sharing sowie Publisher, Abonnenten, Betrachter und Administratoren von Einträgen verwalten

Standardmäßig ist ein Datenpool privat. Nur Nutzer oder Gruppen mit Zugriff auf einen Datenpool können die zugehörigen Daten aufrufen oder abonnieren. Sie können beantragen, dass Ihr Datenpool öffentlich gemacht wird. Wenn Sie Ihren Datenpool öffentlich machen, können Google Cloud -Nutzer (allAuthenticatedUsers) Einträge finden und abonnieren.

Hinweise

Damit Sie BigQuery Sharing (früher Analytics Hub) nutzen können, müssen Sie die Analytics Hub API in Ihrem Google Cloud -Projekt aktivieren.

Zum Aktivieren der Analytics Hub API benötigen Sie die folgenden IAM-Berechtigungen (Identity and Access Management):

  • serviceUsage.services.get
  • serviceUsage.services.list
  • serviceUsage.services.enable

Die folgende vordefinierte IAM-Rolle enthält die Berechtigungen, die Sie zum Aktivieren der Analytics Hub API benötigen:

Wählen Sie eine der folgenden Optionen aus, um die Analytics Hub API zu aktivieren:

Console

Rufen Sie die Seite Analytics Hub API auf und aktivieren Sie die Analytics Hub API für Ihr Google Cloud Projekt.

Analytics Hub API aktivieren

gcloud

Führen Sie den Befehl gcloud services enable aus:

gcloud services enable analyticshub.googleapis.com

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Analytics Hub Administrator (roles/analyticshub.admin) für Ihr Projekt zuzuweisen, damit Sie die Berechtigungen erhalten, die Sie zum Verwalten von Datenpools benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Datenpool erstellen

So erstellen Sie einen Datenpool:

Console

  1. Rufen Sie die Seite Sharing (Analytics Hub) auf.

    Sharing (Analytics Hub) aufrufen

  2. Klicken Sie auf  Datenpool erstellen.

  3. Wählen Sie im Dialogfeld Datenpool erstellen ein Projekt und eine Region für den Datenpool aus. Sie können das Projekt und die Region nicht aktualisieren, nachdem Sie den Datenpool erstellt haben.

  4. Geben Sie im Feld Anzeigename einen Namen für den Datenpool ein.

  5. Optional: Geben Sie Werte in die folgenden Felder ein:

    • Primärer Kontakt: Geben Sie die URL oder die E-Mail-Adresse des primären Kontakts für den Datenpool ein.
    • Beschreibung: Geben Sie eine Beschreibung für den Datenpool ein.
  6. Wenn Sie die Prinzipal-IDs aller Nutzer protokollieren möchten, die Jobs und Abfragen für verknüpfte Datasets ausführen, klicken Sie auf den Ein/Aus-Button Logging der E‑Mail-Adressen von Abonnenten. Wenn Sie diese Option aktivieren, ist das Logging von Abonnenten-E‑Mails für alle zukünftigen Einträge im Datenpool aktiviert. Die protokollierten Daten sind im Feld job_principal_subject der INFORMATION_SCHEMA.SHARED_DATASET_USAGE-Ansicht verfügbar.

  7. Klicken Sie auf den Ein/Aus-Button Öffentliche Sichtbarkeit, um die öffentliche Sichtbarkeit zu aktivieren. Wenn ein Datenpool öffentlich sichtbar ist, erscheinen alle Einträge im Datenpool und sind im Katalog suchbar. Wenn Sie die öffentliche Sichtbarkeit aktivieren, müssen Sie die Berechtigungen des Datenpools konfigurieren. Alle Einträge übernehmen standardmäßig die Einstellung für die öffentliche Sichtbarkeit des Datenpools. Aufgrund der Übernahme von Einstellungen können öffentliche Datenpools keine privaten Einträge haben, private Datenpools können jedoch öffentliche Einträge haben. Sie können den Typ der öffentlichen Sichtbarkeit auf der Ebene einzelner Einträge festlegen. Das Projekt, in dem Sie den Datenpool erstellen, muss eine Organisation und ein Rechnungskonto haben.

  8. Klicken Sie auf Datenpool erstellen.

  9. Optional: Führen Sie im Abschnitt Datenpool-Berechtigungen die folgenden Schritte aus:

    1. Geben Sie die E-Mail-Adressen in die folgenden Felder ein, um die IAM-Rollen (Identity and Access Management) zuzuweisen:

    2. Klicken Sie zum Speichern von Berechtigungen auf Berechtigungen festlegen.

  10. Wenn Sie keine Berechtigungen für den Datenpool festgelegt haben, klicken Sie auf Überspringen.

API

Verwenden Sie die Methode projects.locations.dataExchanges.create:

POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/location/LOCATION/dataExchanges?dataExchangeId=DATAEXCHANGE_ID

Ersetzen Sie Folgendes:

  • PROJECT_ID: Die ID des Projekts, in dem Sie den Datenpool erstellen möchten.
  • LOCATION: Der Standort für Ihren Datenpool. Weitere Informationen zu Standorten, die BigQuery Sharing unterstützen, finden Sie unter Unterstützte Regionen.
  • DATAEXCHANGE_ID: die ID für Ihren Datenpool.

Geben Sie im Anfragetext die Details zum Datenpool an.

Wenn die Anfrage erfolgreich ist, enthält der Antworttext die Details zum Datenpool.

Wenn Sie das Logging von Abonnenten-E‑Mails mit dem Feld logLinkedDatasetQueryUserEmail aktivieren, enthält die Datenpoolantwort log_linked_dataset_query_user_email: true. Die protokollierten Daten sind im Feld job_principal_subject der INFORMATION_SCHEMA.SHARED_DATASET_USAGE-Ansicht verfügbar.

Weitere Informationen zu den Aufgaben, die Sie für Datenpools anhand von APIs ausführen können, finden Sie unter projects.locations.dataExchanges-Methoden.

Datenpool aktualisieren

So aktualisieren Sie einen Datenpool:

Console

  1. Rufen Sie die Seite Sharing (Analytics Hub) auf.

    Sharing (Analytics Hub) aufrufen

  2. Wählen Sie in der Liste den Datenpool aus, den Sie aktualisieren möchten.

  3. Wechseln Sie zum Tab Details.

  4. Klicken Sie auf Datenpool bearbeiten.

  5. Aktualisieren Sie im Dialogfeld Datenpool bearbeiten die folgenden Felder:

    • Anzeigename
    • Primärer Kontakt
    • Beschreibung
    • Öffentliche Sichtbarkeit
      • Wenn Sie die öffentliche Sichtbarkeit aktivieren, weisen Sie allUsers oder allAuthenticatedUsers die Rolle „Analytics Hub Viewer“ (roles/analyticshub.viewer) zu.
      • Wenn Sie die öffentliche Sichtbarkeit deaktivieren, entfernen Sie die Rolle „Analytics Hub Viewer“ (roles/analyticshub.viewer) aus allUsers oder allAuthenticatedUsers. Öffentliche Datenpools können keine privaten Einträge haben, private Datenpools können jedoch öffentliche Einträge haben.
    • Logging der E‑Mail-Adressen von Abonnenten

  6. Klicken Sie auf Speichern.

API

Verwenden Sie die Methode projects.locations.dataExchanges.patch:

PATCH https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/location/LOCATION/dataExchanges/DATAEXCHANGE_ID?updateMask=UPDATEMASK

Ersetzen Sie UPDATEMASK durch die Liste der Felder, die Sie aktualisieren möchten. Verwenden Sie zum Aktualisieren mehrerer Werte eine durch Kommas getrennte Liste. Geben Sie beispielsweise displayName,primaryContact ein, um den Anzeigenamen und den primären Kontakt für einen Datenpool zu aktualisieren.

Geben Sie im Anfragetext aktualisierte Werte für die folgenden Felder an:

  • displayName
  • description
  • primaryContact
  • documentation
  • icon
  • discoveryType
  • logLinkedDatasetQueryUserEmail

Weitere Informationen zu diesen Feldern finden Sie unter Ressource: DataExchange.

Weitere Informationen zu den Aufgaben, die Sie für Datenpools anhand von APIs ausführen können, finden Sie unter projects.locations.dataExchanges-Methoden.

Datenpools ansehen

So rufen Sie Datenpools in Projekten oder Organisationen auf, auf die Sie Zugriff haben:

Console

  1. Rufen Sie die Seite Sharing (Analytics Hub) auf.

    Sharing (Analytics Hub) aufrufen

  2. Auf der Seite werden die Datenpools in Ihrem Google Cloud -Projekt angezeigt. Wenn Sie die Berechtigung resourcemanager.organizations.get haben, können Sie auch den Datenpool in Ihrer Google Cloud -Organisation sehen.

API

Verwenden Sie die Methode projects.locations.dataExchanges.list, um Datenpools in Ihrem Projekt aufzurufen:

GET https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/location/LOCATION/dataExchanges

Ersetzen Sie Folgendes:

  • PROJECT_ID: Projekt-ID.
  • LOCATION: der Standort, für den Sie die vorhandenen Datenpools auflisten möchten.

Verwenden Sie die Methode organizations.locations.dataExchanges.list, um Datenpools in Ihrer Organisation aufzurufen:

GET https://analyticshub.googleapis.com/v1/organizations/ORGANIZATION_ID/location/LOCATION/dataExchanges

Ersetzen Sie Folgendes:

  • ORGANIZATION_ID: die Organisations-ID. Weitere Informationen finden Sie unter Organisations-ID abrufen.
  • LOCATION: der Standort, für den Sie die vorhandenen Datenpools auflisten möchten.

Datenpools freigeben

Wenn der BigQuery Sharing-Publisher zu einer anderen Organisation gehört als die Organisation, die den Datenpool enthält, kann der Publisher Ihren Datenpool in BigQuery Sharing nicht aufrufen. Geben Sie dem Publisher einen Link zum Datenpool weiter.

  1. Rufen Sie die Seite Sharing (Analytics Hub) auf.

    Sharing (Analytics Hub) aufrufen

  2. Klicken Sie in der Liste der Datenpools auf  Weitere Optionen.

  3. Klicken Sie auf Link zur Freigabe kopieren.

Nutzern Zugriff auf einen Datenpool gewähren

Damit Nutzer auf einen Datenpool zugreifen können, müssen Sie die IAM-Richtlinie für diesen Datenpool festlegen. Informationen zu vordefinierten IAM-Nutzerrollen finden Sie unter IAM-Rollen für BigQuery Sharing.

Console

  1. Rufen Sie in der Google Cloud -Console die Seite Sharing (Analytics Hub) auf.

    Sharing (Analytics Hub) aufrufen

  2. Klicken Sie auf den Namen des Datenpools, für den Sie Berechtigungen festlegen möchten.

  3. Wechseln Sie zum Tab Details.

  4. Klicken Sie auf Berechtigungen festlegen.

  5. Klicken Sie zum Hinzufügen von Prinzipalen auf Prinzipale hinzufügen.

  6. Fügen Sie im Feld Neue Prinzipale die E-Mail-Adressen hinzu, für die Sie den Zugriff gewähren möchten. Sie können auch allUsers verwenden, um eine Ressource öffentlich und für alle im Internet zugänglich zu machen, oder allAuthenticatedUsers, um sie nur für angemeldete Google-Nutzer zugänglich zu machen.

  7. Wählen Sie im Menü Rolle auswählen die Option Analytics Hub und dann eine der folgenden IAM-Rollen (Identity and Access Management) aus:

    • Analytics Hub Admin
    • Analytics Hub Listing Admin
    • Analytics Hub Publisher
    • Analytics Hub Subscriber
    • Analytics Hub Subscription Owner
    • Analytics Hub Viewer
  8. Klicken Sie auf Speichern.

API

  1. Lesen Sie die vorhandene Richtlinie mit der Eintragsmethode getIamPolicy. Verwenden Sie dazu die Methode projects.locations.dataExchanges.getIamPolicy:

    POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/DATAEXCHANGE_ID:getIamPolicy
    

    Dabei gilt:

    • PROJECT_ID: die Projekt-ID, z. B. my-project-1.
    • LOCATION: der Standort für Ihren Datenpool. Verwenden Sie Kleinbuchstaben.
    • DATAEXCHANGE_ID: die Datenpool-ID.

    BigQuery Sharing (früher Analytics Hub) gibt die aktuelle Richtlinie zurück.

  2. Bearbeiten Sie die Richtlinie mit einem Texteditor, um Mitglieder und ihre zugehörigen IAM-Rollen (Identity and Access Management) hinzuzufügen oder zu entfernen. Verwenden Sie das folgende Format, um Mitglieder hinzuzufügen:

    • user:test-user@gmail.com
    • group:admins@example.com
    • serviceAccount:test123@example.domain.com
    • domain:example.domain.com

    Fügen Sie der Richtlinie beispielsweise die folgende Bindung hinzu, um group:subscribers@example.com die Rolle roles/analyticshub.subscriber zuzuweisen:

    {
     "members": [
       "group:subscribers@example.com"
     ],
     "role":"roles/analyticshub.subscriber"
    }
    
  3. Verwenden Sie die Methode projects.locations.dataExchanges.setIamPolicy, um die aktualisierte Richtlinie zu schreiben. Geben Sie im Anfragetext die aktualisierte IAM-Richtlinie aus dem vorherigen Schritt an.

    POST https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/DATAEXCHANGE_ID:setIamPolicy
    

    Geben Sie im Anfragetext die Eintragsdetails an. Wenn die Anfrage erfolgreich ist, enthält der Antworttext Details zum Eintrag.

BigQuery Sharing-Administratoren erstellen

Zum Verwalten von Datenpools müssen Sie Datenpooladministratoren erstellen, indem Sie Nutzern auf Projekt- oder Datenpoolebene die Rolle „Analytics Hub Administrator“ (roles/analyticshub.admin) zuweisen.

Wenn Sie möchten, dass Administratoren alle Datenpools in einem Projekt verwalten, weisen Sie ihnen die Rolle „Analytics Hub Administrator” für dieses Projekt zu.

Wenn Sie möchten, dass Administratoren einen bestimmten Datenpool verwalten, weisen Sie ihnen die Rolle „Analytics Hub Administrator” für diesen Datenpool zu.

Datenpool öffentlich machen

Standardmäßig ist ein Datenpool privat. Nur Nutzer oder Gruppen mit Zugriff auf einen Datenpool können die Einträge aufrufen oder abonnieren. Sie können einen Datenpool öffentlich machen. Dann können Google Cloud -Nutzer (allAuthenticatedUsers) die Einträge des Datenpools finden und abonnieren.

So machen Sie einen Datenpool öffentlich:

  1. Damit allAuthenticatedUsers Einträge ansehen kann, weisen Sie ihm auf Datenpoolebene die Rolle „Analytics Hub Viewer“ (roles/analyticshub.viewer) zu.

  2. Damit allAuthenticatedUsers Einträge abonnieren kann, weisen Sie ihm auf Datenpoolebene die Rolle „Analytics Hub Subscriber“ (roles/analyticshub.subscriber) zu.

  3. Aktivieren Sie die öffentliche Sichtbarkeit, wenn Sie einen Datenpool erstellen oder aktualisieren. Geben Sie die entsprechenden Berechtigungen an, wenn Sie einen Datenpool öffentlich machen.

Datenpool löschen

Wenn Sie einen Datenpool löschen, werden auch alle zugehörigen Einträge gelöscht. Freigegebene und verknüpfte Datasets werden jedoch nicht gelöscht. Wenn Sie ein Projekt löschen, werden die zugehörigen Datenpools nicht gelöscht. Löschen Sie diese Datenpools, bevor Sie das Projekt löschen. Das Löschen eines Datenpools kann nicht rückgängig gemacht werden.

Bevor Sie einen Datenpool löschen, führen Sie die folgenden Schritte aus, die von der Konfiguration des Datenpools abhängen:

So löschen Sie einen Datenpool:

Console

  1. Rufen Sie die Seite Sharing (Analytics Hub) auf.

    Sharing (Analytics Hub) aufrufen

  2. Wählen Sie in der Liste den Datenpool aus, den Sie löschen möchten.

  3. Wechseln Sie zum Tab Details.

  4. Klicken Sie auf Datenpool löschen.

  5. Bestätigen Sie im Dialogfeld Datenpool löschen? den Löschvorgang, indem Sie Löschen eingeben.

  6. Klicken Sie auf Löschen.

API

Verwenden Sie die Methode projects.locations.dataExchanges.delete:

DELETE https://analyticshub.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/dataExchanges/DATAEXCHANGE_ID

Ersetzen Sie Folgendes:

  • PROJECT_ID: Die ID des Projekts, in dem Sie den Datenpool erstellen möchten.
  • LOCATION: Der Standort für Ihren Datenpool. Weitere Informationen zu Standorten, die BigQuery Sharing unterstützen, finden Sie unter Unterstützte Regionen.
  • DATAEXCHANGE_ID: die ID für Ihren Datenpool.

Weitere Informationen zu den Aufgaben, die Sie für den Datenpool anhand von APIs ausführen können, finden Sie unter projects.locations.dataExchanges-Methoden.

Nächste Schritte