Auf dieser Seite erfahren Sie, wie Sie Konfigurationen für Storage Insights-Datasets verwalten, um die Quelle, den Umfang und die Aufbewahrung Ihrer Daten zu steuern. Sie erfahren, wie Sie Konfigurationen aufrufen, auflisten, aktualisieren und löschen sowie verknüpfte Datasets aufrufen, abfragen und die Verknüpfung aufheben.
Erforderliche Rollen abrufen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihre Quellprojekte zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Verwalten von Dataset-Konfigurationen benötigen:
-
Zum Auflisten, Aktualisieren, Löschen und Aufrufen von Dataset-Konfigurationen:
Storage Insights Admin (
roles/storageinsights.admin) -
So rufen Sie Datasets auf und heben die Verknüpfung auf:
-
Storage Insights-Analyst (
roles/storageinsights.analyst) -
BigQuery-Administrator (
roles/bigquery.admin)
-
Storage Insights-Analyst (
-
So löschen Sie verknüpfte Datasets:
BigQuery-Administrator (
roles/bigquery.admin) -
So rufen Sie Datasets in BigQuery auf und fragen sie ab:
-
Betrachter von Storage Insights (
roles/storageinsights.viewer) -
BigQuery Job User (
roles/bigquery.jobUser) -
BigQuery Data Viewer (
roles/bigquery.dataViewer)
-
Betrachter von Storage Insights (
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Verwalten von Dataset-Konfigurationen erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Dataset-Konfigurationen zu verwalten:
-
Dataset-Konfiguration ansehen und auflisten:
-
storageinsights.datasetConfigs.get -
storageinsights.datasetConfigs.list -
storage.buckets.getObjectInsights
-
-
Dataset-Konfiguration aktualisieren und löschen:
-
storageinsights.datasetConfigs.update -
storageinsights.datasetConfigs.delete -
storage.buckets.getObjectInsights
-
-
Verknüpfung zum BigQuery-Dataset aufheben:
storageinsights.datasetConfigs.unlinkDataset -
Mit BigQuery verknüpfte Datasets abfragen:
bigquery.jobs.create or bigquery.jobs.*
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Verknüpfte Datasets ansehen und abfragen
So rufen Sie verknüpfte Datasets auf und fragen sie ab:
- Wechseln Sie in der Google Cloud Console unter „Cloud Storage“ zur Seite Storage Insights.
In Ihrem Projekt wird eine Liste der erstellten Dataset-Konfigurationen angezeigt.
Klicken Sie auf das verknüpfte BigQuery-Dataset für die Dataset-Konfiguration, die Sie aufrufen möchten.
In der Google Cloud Konsole wird das mit BigQuery verknüpfte Dataset angezeigt. Informationen zum Dataset-Schema der Metadaten finden Sie unter Dataset-Schema der Metadaten.
Sie können Tabellen und Ansichten in Ihren verknüpften Datasets genauso wie alle anderen BigQuery-Tabellen abfragen.
Verknüpfung eines Datasets aufheben
Wenn Sie verhindern möchten, dass die Dataset-Konfiguration im BigQuery-Dataset veröffentlicht wird, heben Sie die Verknüpfung des Datasets auf. So heben Sie die Verknüpfung eines Datasets auf:
Console
- Wechseln Sie in der Google Cloud Console unter „Cloud Storage“ zur Seite Storage Insights.
Klicken Sie auf den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.
Klicken Sie im Bereich Mit BigQuery verknüpftes Dataset auf Verknüpfung des Datasets aufheben.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs delete-linkaus, um die Verknüpfung des Datasets aufzuheben:gcloud storage insights dataset-configs delete-link DATASET_CONFIG_ID --location=LOCATION
Ersetzen Sie:
Ersetzen Sie
DATASET_CONFIG_IDdurch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.LOCATIONdurch den Speicherort Ihres Datasets und die Dataset-Konfiguration. Beispiel:us-central1
Sie können auch einen vollständigen Pfad für die Dataset-Konfiguration angeben. Beispiel:
gcloud storage insights dataset-configs delete-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Ersetzen Sie:
Ersetzen Sie
DESTINATION_PROJECT_IDdurch die ID des Projekts, das die Dataset-Konfiguration enthält. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.Ersetzen Sie
DATASET_CONFIG_IDdurch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.LOCATIONdurch den Speicherort Ihres Datasets und der Dataset-Konfiguration. Beispiel:us-central1
JSON API
Installieren und initialisieren Sie die gcloud CLI, um ein Zugriffstoken für den
Authorization-Header zu generieren.Erstellen Sie eine JSON-Datei, die folgende Informationen enthält:
{ "name": "DATASET_NAME" }
Ersetzen Sie:
DATASET_NAMEdurch den Namen des Datasets, dessen Verknüpfung Sie aufheben möchten. Beispiel:my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2Verwenden Sie
cURL, um die JSON API mit einerunlinkDataset-DatasetConfig-Anfrage aufzurufen:curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID:unlinkDataset?" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Ersetzen Sie:
JSON_FILE_NAMEdurch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben.PROJECT_IDdurch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATIONdurch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1Ersetzen Sie
DATASET_CONFIG_IDdurch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.SERVICE_ACCOUNTdurch das Dienstkonto. Beispiel:test-service-account@test-project.iam.gserviceaccount.com.
Dataset-Konfiguration ansehen
So rufen Sie die Konfiguration eines Datasets auf:
Console
- Wechseln Sie in der Google Cloud Console unter „Cloud Storage“ zur Seite Storage Insights.
Klicken Sie auf den Namen der Dataset-Konfiguration, die Sie aufrufen möchten.
Die Details der Dataset-Konfiguration werden angezeigt.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs describeaus, um eine Dataset-Konfiguration zu beschreiben:gcloud storage insights dataset-configs describe DATASET_CONFIG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_IDdurch den Namen der Dataset-Konfiguration.Ersetzen Sie
LOCATIONdurch den Speicherort des Datasets und die Dataset-Konfiguration.
Sie können auch einen vollständigen Pfad für die Dataset-Konfiguration angeben. Beispiel:
gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Ersetzen Sie:
Ersetzen Sie
DESTINATION_PROJECT_IDdurch die ID des Projekts, das die Dataset-Konfiguration enthält. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.DATASET_CONFIG_IDdurch den Namen der Datasetkonfiguration, mit der das Dataset generiert wurde, das Sie aufrufen möchten.Ersetzen Sie
LOCATIONdurch den Speicherort Ihres Datasets und der Dataset-Konfiguration. Beispiel:us-central1
JSON API
Installieren und initialisieren Sie die gcloud CLI, um ein Zugriffstoken für den
Authorization-Header zu generieren.Verwenden Sie
cURL, um die JSON API mit einerGet-DatasetConfig-Anfrage aufzurufen:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Ersetzen Sie:
PROJECT_IDdurch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATIONdurch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1DATASET_CONFIG_IDdurch den Namen der Dataset-Konfiguration.SERVICE_ACCOUNTdurch das Dienstkonto. Beispiel:test-service-account@test-project..
Dataset-Konfigurationen auflisten
So listen Sie die Dataset-Konfigurationen in einem Projekt auf:
Console
- Wechseln Sie in der Google Cloud Console unter „Cloud Storage“ zur Seite Storage Insights.
Die Liste der Dataset-Konfigurationen wird angezeigt.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs listaus, um die Dataset-Konfigurationen in einem Projekt aufzulisten:gcloud storage insights dataset-configs list --location=LOCATION
Ersetzen Sie:
- Ersetzen Sie
LOCATIONdurch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
Mit den folgenden optionalen Flags können Sie das Verhalten des Auflistungsaufrufs angeben:
Mit
--page-sizekönnen Sie die maximale Anzahl der Ergebnisse angeben, die pro Seite zurückgegeben werden sollen.Verwenden Sie
--filter=FILTER, um die Ergebnisse zu filtern. Weitere Informationen zur Verwendung des Flags--filtererhalten Sie, wenn Siegcloud topic filtersausführen und die Dokumentation lesen.Mit
--sort-by=SORT_BY_VALUEkönnen Sie eine durch Kommas getrennte Liste von Schlüsselnamen für Ressourcenfelder angeben, nach denen sortiert werden soll. Beispiel:--sort-by=DATASET_CONFIG_ID.
- Ersetzen Sie
JSON API
Installieren und initialisieren Sie die gcloud CLI, um ein Zugriffstoken für den
Authorization-Header zu generieren.Verwenden Sie
cURL, um die JSON API mit einerGet-DatasetConfig-Anfrage aufzurufen:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Ersetzen Sie:
PROJECT_IDdurch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATIONdurch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1SERVICE_ACCOUNTdurch das Dienstkonto. Beispiel:test-service-account@test-project.iam.gserviceaccount.com.
Dataset-Konfiguration aktualisieren
So aktualisieren Sie eine Dataset-Konfiguration:
Console
- Wechseln Sie in der Google Cloud Console unter „Cloud Storage“ zur Seite Storage Insights.
Klicken Sie auf den Namen der Dataset-Konfiguration, die Sie aktualisieren möchten.
Klicken Sie auf dem Tab Dataset-Konfiguration auf Bearbeiten , um die Felder zu aktualisieren.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs updateaus, um eine Dataset-Konfiguration zu aktualisieren:gcloud storage insights dataset-configs update DATASET_CONFIG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_IDdurch den Namen der Dataset-Konfiguration.LOCATIONmit dem Speicherort des Datasets und der Dataset-Konfiguration.
Mit den folgenden Flags können Sie die Attribute der Dataset-Konfiguration aktualisieren:
Verwenden Sie
--skip-verification, um Prüfungen und Fehler aus dem Bestätigungsprozess zu überspringen. Dazu gehören auch Prüfungen auf erforderliche IAM-Berechtigungen. Wenn sie verwendet werden, werden einige oder alle Buckets möglicherweise aus dem Dataset ausgeschlossen.Mit
--retention-period-days=DAYSgeben Sie die Anzahl der Tage an, die im Dataset-Snapshot berücksichtigt werden sollen. Beispiel:90.Verwenden Sie
--activity-data-retention-period-days=ACTIVITY_RETENTION_PERIOD_DAYS, um die Aufbewahrungsdauer für die Aktivitätsdaten im Dataset anzugeben. Aktivitätsdaten sind standardmäßig im Dataset enthalten und übernehmen die Aufbewahrungsdauer des Datasets. Wenn Sie die Aufbewahrungsdauer für das Dataset überschreiben möchten, geben Sie die Anzahl der Tage an, für die Aktivitätsdaten aufbewahrt werden sollen. Wenn Sie Aktivitätsdaten ausschließen möchten, setzen Sie ACTIVITY_RETENTION_PERIOD_DAYS auf0.Verwenden Sie
--description=DESCRIPTION, um eine Beschreibung für die Dataset-Konfiguration zu schreiben.Verwenden Sie
--organization=ORGANIZATION_ID, um die Organisations-ID des Quellprojekts anzugeben. Wenn nicht angegeben, wird standardmäßig die Organisations-ID des Quellprojekts verwendet.
JSON API
Installieren und initialisieren Sie die gcloud CLI, um ein Zugriffstoken für den
Authorization-Header zu generieren.Erstellen Sie eine JSON-Datei, die die folgenden optionalen Informationen enthält:
{ "organization_number": "ORGANIZATION_ID", "source_projects": { "project_numbers": "PROJECT_NUMBERS" }, "retention_period_days": "RETENTION_PERIOD", "activityDataRetentionPeriodDays": "ACTIVITY_DATA_RETENTION_PERIOD_DAYS" }
Ersetzen Sie:
Ersetzen Sie
ORGANIZATION_IDdurch die Ressourcen-ID der Organisation, zu der die Quellprojekte gehören. Wenn nicht angegeben, wird standardmäßig die Organisations-ID des Quellprojekts verwendet.Ersetzen Sie
PROJECT_NUMBERSdurch die Projektnummern, die im Dataset enthalten sein sollen. Sie können ein oder mehrere Projekte in einem Listenformat angeben.RETENTION_PERIODmit der gleitenden Anzahl von Tagen an Daten, die im Dataset-Snapshot erfasst werden sollen. Beispiel:90.ACTIVITY_DATA_RETENTION_PERIOD_DAYSmit der Anzahl der Tage an Aktivitätsdaten, die im Dataset-Snapshot erfasst werden sollen. Standardmäßig sind Aktivitätsdaten im Dataset enthalten und übernehmen die Aufbewahrungsdauer des Datasets. Wenn Sie die Aufbewahrungsdauer für das Dataset überschreiben möchten, geben Sie die Anzahl der Tage an, für die Aktivitätsdaten aufbewahrt werden sollen. Wenn Sie Aktivitätsdaten ausschließen möchten, setzen Sie ACTIVITY_RETENTION_PERIOD_DAYS auf0.
Um die Dataset-Konfiguration zu aktualisieren, verwenden Sie
cURL, um die JSON API mit einerPatch-DatasetConfig-Anfrage aufzurufen:curl -X PATCH --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID?updateMask=UPDATE_MASK" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Ersetzen Sie:
JSON_FILE_NAMEdurch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben.PROJECT_IDdurch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATIONdurch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1DATASET_CONFIG_IDdurch den Namen der Datasetkonfiguration, die Sie aktualisieren möchten.UPDATE_MASKist die durch Kommas getrennte Liste der Feldnamen, die in dieser Anfrage aktualisiert werden sollen. Die Felder verwenden das fieldMask-Format und sind Teil der RessourceDatasetConfig.SERVICE_ACCOUNTdurch das Dienstkonto. Zum Beispieltest-service-account@test-project.iam.gserviceaccount.com.
Dataset-Konfiguration löschen
So löschen Sie eine Dataset-Konfiguration:
Console
- Wechseln Sie in der Google Cloud Console unter „Cloud Storage“ zur Seite Storage Insights.
Klicken Sie auf den Namen der Datasetkonfiguration, die Sie löschen möchten.
Klicken Sie auf Löschen .
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs deleteaus, um eine Dataset-Konfiguration zu löschen:gcloud storage insights dataset-configs delete DATASET_CONFIG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_IDdurch den Namen der Dataset-Konfiguration, die Sie löschen möchten.Ersetzen Sie
LOCATIONdurch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
Verwenden Sie die folgenden Flags, um eine Dataset-Konfiguration zu löschen:
- Verwenden Sie
--auto-delete-link, um die Verknüpfung des Datasets aufzuheben, das aus der Dataset-Konfiguration generiert wurde, die Sie löschen möchten. Sie müssen die Verknüpfung eines Datasets aufheben, bevor Sie die Dataset-Konfiguration löschen können, mit der das Dataset erstellt wurde.
Sie können auch einen vollständigen Pfad für die Dataset-Konfiguration angeben. Beispiel:
gcloud storage insights dataset-configs delete projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
JSON API
Installieren und initialisieren Sie die gcloud CLI, um ein Zugriffstoken für den
Authorization-Header zu generieren.Verwenden Sie
cURL, um die JSON API mit einerDelete-DatasetConfig-Anfrage aufzurufen:curl -X DELETE \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"Ersetzen Sie:
PROJECT_IDdurch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATIONdurch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1DATASET_CONFIG_IDdurch den Namen der Dataset-Konfiguration, die Sie löschen möchten.SERVICE_ACCOUNTdurch das Dienstkonto. Beispiel:test-service-account@test-project.iam.gserviceaccount.com.
Nächste Schritte
- Verknüpfte Datasets aufrufen
- Verknüpftes Dataset abfragen
- Gespeicherte Daten mit Gemini Cloud Assist analysieren