En esta página se explica cómo gestionar las configuraciones de conjuntos de datos de Estadísticas de almacenamiento para controlar la fuente, el ámbito y la conservación de tus datos. Aprenderás a ver, enumerar, actualizar y eliminar configuraciones, así como a ver, consultar y desvincular tus conjuntos de datos vinculados.
Obtener los roles necesarios
Para obtener los permisos que necesitas para gestionar las configuraciones de conjuntos de datos, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos en tus proyectos de origen:
-
Para enumerar, actualizar, eliminar y ver las configuraciones de conjuntos de datos, sigue estos pasos:
Storage Insights Admin (
roles/storageinsights.admin) -
Para ver y desvincular conjuntos de datos, sigue estos pasos:
-
Analista de Estadísticas de almacenamiento (
roles/storageinsights.analyst) -
Administrador de BigQuery (
roles/bigquery.admin)
-
Analista de Estadísticas de almacenamiento (
-
Para eliminar conjuntos de datos vinculados, siga estos pasos:
Administrador de BigQuery (
roles/bigquery.admin) -
Para ver y consultar conjuntos de datos en BigQuery, sigue estos pasos:
-
Lector de estadísticas de almacenamiento (
roles/storageinsights.viewer) -
Usuario de tareas de BigQuery (
roles/bigquery.jobUser) -
Lector de datos de BigQuery (
roles/bigquery.dataViewer)
-
Lector de estadísticas de almacenamiento (
Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar acceso a proyectos, carpetas y organizaciones.
Estos roles predefinidos contienen los permisos necesarios para gestionar las configuraciones de conjuntos de datos. Para ver los permisos exactos que se necesitan, despliega la sección Permisos necesarios:
Permisos obligatorios
Para gestionar las configuraciones de conjuntos de datos, se necesitan los siguientes permisos:
-
Ver y enumerar la configuración del conjunto de datos:
-
storageinsights.datasetConfigs.get -
storageinsights.datasetConfigs.list -
storage.buckets.getObjectInsights
-
-
Actualizar y eliminar la configuración de un conjunto de datos:
-
storageinsights.datasetConfigs.update -
storageinsights.datasetConfigs.delete -
storage.buckets.getObjectInsights
-
-
Desvincular del conjunto de datos de BigQuery:
storageinsights.datasetConfigs.unlinkDataset -
Consultar conjuntos de datos vinculados de BigQuery:
bigquery.jobs.create or bigquery.jobs.*
También puedes obtener estos permisos con roles personalizados u otros roles predefinidos.
Ver y consultar conjuntos de datos vinculados
Para ver y consultar conjuntos de datos vinculados, sigue estos pasos:
- En la Google Cloud consola, ve a la página Storage Insights de Cloud Storage.
Ir a Estadísticas de almacenamiento
En tu proyecto se muestra una lista de las configuraciones de conjuntos de datos creadas.
Haga clic en el conjunto de datos vinculado de BigQuery cuya configuración quiera ver.
La Google Cloud consola muestra el conjunto de datos vinculado de BigQuery. Para obtener información sobre el esquema de conjunto de datos de los metadatos, consulta Esquema de conjunto de datos de los metadatos.
Puede consultar tablas y vistas de sus conjuntos de datos vinculados de la misma forma que consultaría cualquier otra tabla de BigQuery.
Desvincular un conjunto de datos
Para evitar que la configuración del conjunto de datos se publique en el conjunto de datos de BigQuery, desvincule el conjunto de datos. Para desvincular un conjunto de datos, sigue estos pasos:
Consola
- En la Google Cloud consola, ve a la página Storage Insights de Cloud Storage.
Haz clic en el nombre de la configuración del conjunto de datos que ha generado el conjunto de datos que quieres desvincular.
En la sección Conjunto de datos vinculado de BigQuery, haga clic en Desvincular conjunto de datos.
Línea de comandos
Para desvincular el conjunto de datos, ejecuta el comando
gcloud storage insights dataset-configs delete-link:gcloud storage insights dataset-configs delete-link DATASET_CONFIG_ID --location=LOCATION
Sustituye:
DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos que generó el conjunto de datos que quieres desvincular.LOCATIONcon la ubicación de tu conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.
También puedes especificar una ruta de configuración de conjunto de datos completa. Por ejemplo:
gcloud storage insights dataset-configs delete-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Sustituye:
DESTINATION_PROJECT_IDcon el ID del proyecto que contiene la configuración del conjunto de datos. Para obtener más información sobre los IDs de proyecto, consulta el artículo Crea y gestiona proyectos.DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos que ha generado el conjunto de datos que quieres desvincular.LOCATIONcon la ubicación de tu conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.
API JSON
Tener gcloud CLI instalado e inicializado, lo que te permite generar un token de acceso para el encabezado
Authorization.Crea un archivo JSON que contenga la siguiente información:
{ "name": "DATASET_NAME" }
Sustituye:
DATASET_NAMEcon el nombre del conjunto de datos que quieras desvincular. Por ejemplo,my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2.Usa
cURLpara llamar a la API JSON con una solicitudunlinkDatasetDatasetConfig:curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID:unlinkDataset?" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Sustituye:
JSON_FILE_NAMEcon la ruta al archivo JSON que has creado en el paso anterior.PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos que ha generado el conjunto de datos que quieres desvincular.SERVICE_ACCOUNTcon la cuenta de servicio. Por ejemplo,test-service-account@test-project.iam.gserviceaccount.com.
Ver la configuración de un conjunto de datos
Para ver la configuración de un conjunto de datos, sigue estos pasos:
Consola
- En la Google Cloud consola, ve a la página Storage Insights de Cloud Storage.
Haga clic en el nombre de la configuración del conjunto de datos que quiera ver.
Se muestran los detalles de configuración del conjunto de datos.
Línea de comandos
Para describir una configuración de conjunto de datos, ejecuta el comando
gcloud storage insights dataset-configs describe:gcloud storage insights dataset-configs describe DATASET_CONFIG_ID \ --location=LOCATION
Sustituye:
DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos.
También puedes especificar una ruta de configuración de conjunto de datos completa. Por ejemplo:
gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Sustituye:
DESTINATION_PROJECT_IDcon el ID del proyecto que contiene la configuración del conjunto de datos. Para obtener más información sobre los IDs de proyecto, consulta el artículo Crea y gestiona proyectos.DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos que ha generado el conjunto de datos que quieres ver.LOCATIONcon la ubicación de tu conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.
API JSON
Tener gcloud CLI instalado e inicializado, lo que te permite generar un token de acceso para el encabezado
Authorization.Usa
cURLpara llamar a la API JSON con una solicitudGetDatasetConfig:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Sustituye:
PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos.SERVICE_ACCOUNTcon la cuenta de servicio. Por ejemplo,test-service-account@test-project..
Mostrar configuraciones de conjuntos de datos
Para enumerar las configuraciones de conjuntos de datos de un proyecto, sigue estos pasos:
Consola
- En la Google Cloud consola, ve a la página Storage Insights de Cloud Storage.
Ir a Estadísticas de almacenamiento
Se muestra la lista de configuraciones de conjuntos de datos.
Línea de comandos
Para enumerar las configuraciones de conjuntos de datos de un proyecto, ejecuta el comando
gcloud storage insights dataset-configs list:gcloud storage insights dataset-configs list --location=LOCATION
Sustituye:
LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.
Puedes usar las siguientes marcas opcionales para especificar el comportamiento de la llamada de listado:
Usa
--page-sizepara especificar el número máximo de resultados que se devolverán por página.Usa
--filter=FILTERpara filtrar los resultados. Para obtener más información sobre cómo usar la marca--filter, ejecutagcloud topic filtersy consulta la documentación.Usa
--sort-by=SORT_BY_VALUEpara especificar una lista de nombres de claves de campos de recursos separados por comas para ordenar. Por ejemplo,--sort-by=DATASET_CONFIG_ID.
API JSON
Tener gcloud CLI instalado e inicializado, lo que te permite generar un token de acceso para el encabezado
Authorization.Usa
cURLpara llamar a la API JSON con una solicitudGetDatasetConfig:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Sustituye:
PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.SERVICE_ACCOUNTcon la cuenta de servicio. Por ejemplo,test-service-account@test-project.iam.gserviceaccount.com.
Actualizar la configuración de un conjunto de datos
Para actualizar la configuración de un conjunto de datos, sigue estos pasos:
Consola
- En la Google Cloud consola, ve a la página Storage Insights de Cloud Storage.
Haga clic en el nombre de la configuración del conjunto de datos que quiera actualizar.
En la pestaña Configuración del conjunto de datos, haga clic en Editar para actualizar los campos.
Línea de comandos
Para actualizar la configuración de un conjunto de datos, ejecuta el comando
gcloud storage insights dataset-configs update:gcloud storage insights dataset-configs update DATASET_CONFIG_ID \ --location=LOCATION
Sustituye:
DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos.
Usa las siguientes marcas para actualizar las propiedades de la configuración del conjunto de datos:
Usa
--skip-verificationpara omitir las comprobaciones y los errores del proceso de verificación, que incluye comprobaciones de los permisos de IAM obligatorios. Si se usa, es posible que algunos o todos los contenedores se excluyan del conjunto de datos.Use
--retention-period-days=DAYSpara especificar el número de días de datos que se van a capturar en la instantánea del conjunto de datos. Por ejemplo,90.Usa
--activity-data-retention-period-days=ACTIVITY_RETENTION_PERIOD_DAYSpara especificar el periodo de conservación de los datos de actividad del conjunto de datos. De forma predeterminada, los datos de actividad se incluyen en el conjunto de datos y heredan el periodo de conservación del conjunto de datos. Para anular el periodo de conservación del conjunto de datos, especifica el número de días que quieres conservar los datos de actividad. Para excluir datos de actividad, asigna el valor0a ACTIVITY_RETENTION_PERIOD_DAYS.Usa
--description=DESCRIPTIONpara escribir una descripción de la configuración del conjunto de datos.Use
--organization=ORGANIZATION_IDpara especificar el ID de la organización del proyecto de origen. Si no se especifica, se utiliza el ID de organización del proyecto de origen de forma predeterminada.
API JSON
Tener gcloud CLI instalado e inicializado, lo que te permite generar un token de acceso para el encabezado
Authorization.Crea un archivo JSON que contenga la siguiente información opcional:
{ "organization_number": "ORGANIZATION_ID", "source_projects": { "project_numbers": "PROJECT_NUMBERS" }, "retention_period_days": "RETENTION_PERIOD", "activityDataRetentionPeriodDays": "ACTIVITY_DATA_RETENTION_PERIOD_DAYS" }
Sustituye:
ORGANIZATION_IDcon el ID de recurso de la organización a la que pertenecen los proyectos de origen. Si no se especifica, se usa el ID de organización del proyecto de origen.PROJECT_NUMBERScon los números de proyecto que quieras incluir en el conjunto de datos. Puedes especificar uno o varios proyectos en formato de lista.RETENTION_PERIODcon el número de días de datos que se van a capturar en la instantánea del conjunto de datos. Por ejemplo,90.ACTIVITY_DATA_RETENTION_PERIOD_DAYScon el número de días de datos de actividad que se van a registrar en la instantánea del conjunto de datos. De forma predeterminada, los datos de actividad se incluyen en el conjunto de datos y heredan el periodo de conservación del conjunto de datos. Para anular el periodo de conservación del conjunto de datos, especifica el número de días que quieres conservar los datos de actividad. Para excluir datos de actividad, asigna el valor ACTIVITY_RETENTION_PERIOD_DAYS a0.
Para actualizar la configuración del conjunto de datos, usa
cURLpara llamar a la API JSON con una solicitudPatchDatasetConfig:curl -X PATCH --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID?updateMask=UPDATE_MASK" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Sustituye:
JSON_FILE_NAMEcon la ruta al archivo JSON que has creado en el paso anterior.PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos que quieras actualizar.UPDATE_MASKes la lista de nombres de campos separados por comas que actualiza esta solicitud. Los campos usan el formato fieldMask y forman parte del recursoDatasetConfig.SERVICE_ACCOUNTcon la cuenta de servicio. Por ejemplo,test-service-account@test-project.iam.gserviceaccount.com.
Eliminar una configuración de conjunto de datos
Para eliminar una configuración de conjunto de datos, sigue estos pasos:
Consola
- En la Google Cloud consola, ve a la página Storage Insights de Cloud Storage.
Haz clic en el nombre de la configuración del conjunto de datos que quieras eliminar.
Haz clic en Eliminar .
Línea de comandos
Para eliminar una configuración de conjunto de datos, ejecuta el comando
gcloud storage insights dataset-configs delete:gcloud storage insights dataset-configs delete DATASET_CONFIG_ID \ --location=LOCATION
Sustituye:
DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos que quieras eliminar.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.
Utiliza las siguientes marcas para eliminar una configuración de conjunto de datos:
- Usa
--auto-delete-linkpara desvincular el conjunto de datos que se haya generado a partir de la configuración del conjunto de datos que quieras eliminar. Debes desvincular un conjunto de datos antes de poder eliminar la configuración del conjunto de datos que lo ha generado.
También puedes especificar una ruta de configuración de conjunto de datos completa. Por ejemplo:
gcloud storage insights dataset-configs delete projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
API JSON
Tener gcloud CLI instalado e inicializado, lo que te permite generar un token de acceso para el encabezado
Authorization.Usa
cURLpara llamar a la API JSON con una solicitudDeleteDatasetConfig:curl -X DELETE \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"Sustituye:
PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos. Por ejemplo,us-central1.DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos que quieras eliminar.SERVICE_ACCOUNTcon la cuenta de servicio. Por ejemplo,test-service-account@test-project.iam.gserviceaccount.com.
Siguientes pasos
- Ver conjuntos de datos vinculados.
- Consulta un conjunto de datos vinculado.
- Analiza los datos almacenados con Gemini Cloud Assist.