Questa pagina mostra come gestire le configurazioni dei set di dati di Storage Insights per controllare l'origine, l'ambito e la conservazione dei dati. Scoprirai come visualizzare, elencare, aggiornare ed eliminare le configurazioni, nonché come visualizzare, eseguire query e scollegare i set di dati collegati.
Ottenere i ruoli richiesti
Per ottenere le autorizzazioni necessarie per gestire le configurazioni dei set di dati, chiedi all'amministratore di concederti i seguenti ruoli IAM nei progetti di origine:
-
Per elencare, aggiornare, eliminare e visualizzare le configurazioni dei set di dati:
Storage Insights Admin (
roles/storageinsights.admin) -
Per visualizzare e scollegare i set di dati:
-
Storage Insights Analyst (
roles/storageinsights.analyst) -
BigQuery Admin (
roles/bigquery.admin)
-
Storage Insights Analyst (
-
Per eliminare i set di dati collegati:
Amministratore BigQuery (
roles/bigquery.admin) -
Per visualizzare ed eseguire query sui set di dati in BigQuery:
-
Storage Insights Viewer (
roles/storageinsights.viewer) -
Utente job BigQuery (
roles/bigquery.jobUser) -
Visualizzatore dati BigQuery (
roles/bigquery.dataViewer)
-
Storage Insights Viewer (
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Questi ruoli predefiniti contengono le autorizzazioni necessarie per gestire le configurazioni dei set di dati. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:
Autorizzazioni obbligatorie
Per gestire le configurazioni dei set di dati sono necessarie le seguenti autorizzazioni:
-
Visualizza ed elenca la configurazione del set di dati:
-
storageinsights.datasetConfigs.get -
storageinsights.datasetConfigs.list -
storage.buckets.getObjectInsights
-
-
Aggiorna ed elimina la configurazione del set di dati:
-
storageinsights.datasetConfigs.update -
storageinsights.datasetConfigs.delete -
storage.buckets.getObjectInsights
-
-
Scollega dal set di dati BigQuery:
storageinsights.datasetConfigs.unlinkDataset -
Esegui query sui set di dati collegati a BigQuery:
bigquery.jobs.create or bigquery.jobs.*
Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.
Visualizzare ed eseguire query sui set di dati collegati
Per visualizzare ed eseguire query sui set di dati collegati:
- Nella console Google Cloud , vai alla pagina Storage Insights in Cloud Storage.
Il progetto mostra un elenco delle configurazioni del set di dati create.
Fai clic sul set di dati collegato a BigQuery per la configurazione del set di dati che vuoi visualizzare.
La console Google Cloud mostra il set di dati collegato a BigQuery. Per informazioni sullo schema del set di dati dei metadati, vedi Schema del set di dati dei metadati.
Puoi eseguire query su tabelle e viste nei set di dati collegati nello stesso modo in cui esegui query su qualsiasi altra tabella BigQuery.
Scollegare un set di dati
Per impedire la pubblicazione della configurazione del set di dati nel set di dati BigQuery, scollega il set di dati. Per scollegare un set di dati, completa i seguenti passaggi:
Console
- Nella console Google Cloud , vai alla pagina Storage Insights in Cloud Storage.
Fai clic sul nome della configurazione del set di dati che ha generato il set di dati da scollegare.
Nella sezione Set di dati collegato a BigQuery, fai clic su Scollega set di dati.
Riga di comando
Per scollegare il set di dati, esegui il comando
gcloud storage insights dataset-configs delete-link:gcloud storage insights dataset-configs delete-link DATASET_CONFIG_ID --location=LOCATION
Sostituisci:
DATASET_CONFIG_IDcon il nome della configurazione del set di dati che ha generato il set di dati che vuoi scollegare.LOCATIONcon la posizione del tuo set di dati e la configurazione del set di dati. Ad esempio:us-central1.
Puoi anche specificare un percorso di configurazione completo del set di dati. Ad esempio:
gcloud storage insights dataset-configs delete-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Sostituisci:
DESTINATION_PROJECT_IDcon l'ID del progetto che contiene la configurazione del set di dati. Per saperne di più sugli ID progetto, consulta la pagina Creare e gestire progetti.DATASET_CONFIG_IDcon il nome della configurazione del set di dati che ha generato il set di dati che vuoi scollegare.LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.
API JSON
Avere gcloud CLI installata e inizializzata, il che ti consente di generare un token di accesso per l'intestazione
Authorization.Crea un file JSON contenente le seguenti informazioni:
{ "name": "DATASET_NAME" }
Sostituisci:
DATASET_NAMEcon il nome del set di dati che vuoi scollegare. Ad esempio,my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2.Utilizza
cURLper chiamare l'API JSON con una richiestaunlinkDatasetDatasetConfig:curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID:unlinkDataset?" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Sostituisci:
JSON_FILE_NAMEcon il percorso del file JSON creato nel passaggio precedente.PROJECT_IDcon l'ID del progetto a cui appartiene la configurazione del set di dati.LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.DATASET_CONFIG_IDcon il nome della configurazione del set di dati che ha generato il set di dati che vuoi scollegare.SERVICE_ACCOUNTcon il account di servizio. Ad esempio,test-service-account@test-project.iam.gserviceaccount.com.
Visualizzare una configurazione del set di dati
Per visualizzare la configurazione di un set di dati:
Console
- Nella console Google Cloud , vai alla pagina Storage Insights in Cloud Storage.
Fai clic sul nome della configurazione del set di dati che vuoi visualizzare.
Vengono visualizzati i dettagli di configurazione del set di dati.
Riga di comando
Per descrivere una configurazione del set di dati, esegui il comando
gcloud storage insights dataset-configs describe:gcloud storage insights dataset-configs describe DATASET_CONFIG_ID \ --location=LOCATION
Sostituisci:
DATASET_CONFIG_IDcon il nome della configurazione del set di dati.LOCATIONcon la posizione del set di dati e la configurazione del set di dati.
Puoi anche specificare un percorso di configurazione completo del set di dati. Ad esempio:
gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Sostituisci:
DESTINATION_PROJECT_IDcon l'ID del progetto che contiene la configurazione del set di dati. Per saperne di più sugli ID progetto, consulta la pagina Creare e gestire progetti.DATASET_CONFIG_IDcon il nome della configurazione del set di dati che ha generato il set di dati che vuoi visualizzare.LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.
API JSON
Avere gcloud CLI installata e inizializzata, il che ti consente di generare un token di accesso per l'intestazione
Authorization.Utilizza
cURLper chiamare l'API JSON con una richiestaGetDatasetConfig:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Sostituisci:
PROJECT_IDcon l'ID del progetto a cui appartiene la configurazione del set di dati.LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.DATASET_CONFIG_IDcon il nome della configurazione del set di dati.SERVICE_ACCOUNTcon il account di servizio. Ad esempio,test-service-account@test-project..
Elenca le configurazioni del set di dati
Per elencare le configurazioni del set di dati in un progetto, completa i seguenti passaggi:
Console
- Nella console Google Cloud , vai alla pagina Storage Insights in Cloud Storage.
Viene visualizzato l'elenco delle configurazioni del set di dati.
Riga di comando
Per elencare le configurazioni del set di dati in un progetto, esegui il comando
gcloud storage insights dataset-configs list:gcloud storage insights dataset-configs list --location=LOCATION
Sostituisci:
LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.
Puoi utilizzare i seguenti flag facoltativi per specificare il comportamento della chiamata di elenco:
Utilizza
--page-sizeper specificare il numero massimo di risultati da restituire per pagina.Utilizza
--filter=FILTERper filtrare i risultati. Per maggiori informazioni su come utilizzare il flag--filter, eseguigcloud topic filterse consulta la documentazione.Utilizza
--sort-by=SORT_BY_VALUEper specificare un elenco separato da virgole con i nomi delle chiavi dei campi delle risorse in base a cui eseguire l'ordinamento. Ad esempio,--sort-by=DATASET_CONFIG_ID.
API JSON
Avere gcloud CLI installata e inizializzata, il che ti consente di generare un token di accesso per l'intestazione
Authorization.Utilizza
cURLper chiamare l'API JSON con una richiestaGetDatasetConfig:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Sostituisci:
PROJECT_IDcon l'ID del progetto a cui appartiene la configurazione del set di dati.LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.SERVICE_ACCOUNTcon il account di servizio. Ad esempio,test-service-account@test-project.iam.gserviceaccount.com.
Aggiornare una configurazione del set di dati
Per aggiornare la configurazione di un set di dati:
Console
- Nella console Google Cloud , vai alla pagina Storage Insights in Cloud Storage.
Fai clic sul nome della configurazione del set di dati da aggiornare.
Nella scheda Configurazione del set di dati, fai clic su Modifica per aggiornare i campi.
Riga di comando
Per aggiornare una configurazione del set di dati, esegui il comando
gcloud storage insights dataset-configs update:gcloud storage insights dataset-configs update DATASET_CONFIG_ID \ --location=LOCATION
Sostituisci:
DATASET_CONFIG_IDcon il nome della configurazione del set di dati.LOCATIONcon la posizione del set di dati e la configurazione del set di dati.
Utilizza i seguenti flag per aggiornare le proprietà della configurazione del set di dati:
Utilizza
--skip-verificationper ignorare i controlli e gli errori della procedura di verifica, che include i controlli delle autorizzazioni IAM richieste. Se utilizzati, alcuni o tutti i bucket potrebbero essere esclusi dal set di dati.Utilizza
--retention-period-days=DAYSper specificare il numero mobile di giorni di dati da acquisire nello snapshot del set di dati. Ad esempio,90.Utilizza
--activity-data-retention-period-days=ACTIVITY_RETENTION_PERIOD_DAYSper specificare il periodo di conservazione dei dati delle attività nel set di dati. Per impostazione predefinita, i dati delle attività sono inclusi nel set di dati e ereditano il periodo di conservazione del set di dati. Per ignorare il periodo di conservazione del set di dati, specifica il numero di giorni per cui conservare i dati delle attività. Per escludere i dati sull'attività, imposta ACTIVITY_RETENTION_PERIOD_DAYS su0.Utilizza
--description=DESCRIPTIONper scrivere una descrizione della configurazione del set di dati.Utilizza
--organization=ORGANIZATION_IDper specificare l'ID organizzazione del progetto di origine. Se non specificato, il valore predefinito è l'ID organizzazione del progetto di origine.
API JSON
Avere gcloud CLI installata e inizializzata, il che ti consente di generare un token di accesso per l'intestazione
Authorization.Crea un file JSON contenente le seguenti informazioni facoltative:
{ "organization_number": "ORGANIZATION_ID", "source_projects": { "project_numbers": "PROJECT_NUMBERS" }, "retention_period_days": "RETENTION_PERIOD", "activityDataRetentionPeriodDays": "ACTIVITY_DATA_RETENTION_PERIOD_DAYS" }
Sostituisci:
ORGANIZATION_IDcon l'ID risorsa dell' organizzazione a cui appartengono i progetti di origine. Se non specificato, viene utilizzato l'ID organizzazione del progetto di origine.PROJECT_NUMBERScon i numeri di progetto da includere nel set di dati. Puoi specificare uno o più progetti in formato elenco.RETENTION_PERIODcon il numero mobile di giorni di dati da acquisire nello snapshot del set di dati. Ad esempio,90.ACTIVITY_DATA_RETENTION_PERIOD_DAYScon il numero di giorni di dati sull'attività da acquisire nello snapshot del set di dati. Per impostazione predefinita, i dati delle attività sono inclusi nel set di dati ed ereditano il periodo di conservazione del set di dati. Per ignorare il periodo di conservazione del set di dati, specifica il numero di giorni per cui conservare i dati delle attività. Per escludere i dati sull'attività, imposta ACTIVITY_RETENTION_PERIOD_DAYS su0.
Per aggiornare la configurazione del set di dati, utilizza
cURLper chiamare l'API JSON con una richiestaPatchDatasetConfig:curl -X PATCH --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID?updateMask=UPDATE_MASK" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Sostituisci:
JSON_FILE_NAMEcon il percorso del file JSON che hai creato nel passaggio precedente.PROJECT_IDcon l'ID del progetto a cui appartiene la configurazione del set di dati.LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.DATASET_CONFIG_IDcon il nome della configurazione del set di dati che vuoi aggiornare.UPDATE_MASKè l'elenco separato da virgole dei nomi dei campi che questa richiesta aggiorna. I campi utilizzano il formato fieldMask e fanno parte della risorsaDatasetConfig.SERVICE_ACCOUNTcon il account di servizio. Ad esempio,test-service-account@test-project.iam.gserviceaccount.com.
Eliminare una configurazione del set di dati
Per eliminare una configurazione del set di dati:
Console
- Nella console Google Cloud , vai alla pagina Storage Insights in Cloud Storage.
Fai clic sul nome della configurazione del set di dati che vuoi eliminare.
Fai clic su Elimina .
Riga di comando
Per eliminare una configurazione del set di dati, esegui il comando
gcloud storage insights dataset-configs delete:gcloud storage insights dataset-configs delete DATASET_CONFIG_ID \ --location=LOCATION
Sostituisci:
DATASET_CONFIG_IDcon il nome della configurazione del set di dati che vuoi eliminare.LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.
Utilizza i seguenti flag per eliminare una configurazione del set di dati:
- Utilizza
--auto-delete-linkper scollegare il set di dati generato dalla configurazione del set di dati che vuoi eliminare. Devi scollegare un set di dati prima di poter eliminare la configurazione del set di dati che lo ha generato.
Puoi anche specificare un percorso di configurazione completo del set di dati. Ad esempio:
gcloud storage insights dataset-configs delete projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
API JSON
Avere gcloud CLI installata e inizializzata, il che ti consente di generare un token di accesso per l'intestazione
Authorization.Utilizza
cURLper chiamare l'API JSON con una richiestaDeleteDatasetConfig:curl -X DELETE \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"Sostituisci:
PROJECT_IDcon l'ID del progetto a cui appartiene la configurazione del set di dati.LOCATIONcon la posizione del set di dati e la configurazione del set di dati. Ad esempio:us-central1.DATASET_CONFIG_IDcon il nome della configurazione del set di dati che vuoi eliminare.SERVICE_ACCOUNTcon il account di servizio. Ad esempio,test-service-account@test-project.iam.gserviceaccount.com.
Passaggi successivi
- Visualizza i set di dati collegati.
- Esegui una query su un set di dati collegato.
- Analizza i dati archiviati con Gemini Cloud Assist.