En esta página, se muestra cómo administrar las configuraciones de los conjuntos de datos de Storage Insights para controlar la fuente, el alcance y la retención de tus datos. Aprenderás a ver, enumerar, actualizar y borrar configuraciones, así como a ver, consultar y desvincular tus conjuntos de datos vinculados.
Obtén los roles necesarios
Para obtener los permisos que necesitas para administrar la configuración de los conjuntos de datos, pídele a tu administrador que te otorgue los siguientes roles de IAM en tus proyectos fuente:
-
Para enumerar, actualizar, borrar y ver la configuración de conjuntos de datos:
Administrador de Storage Insights (
roles/storageinsights.admin) -
Para ver y desvincular conjuntos de datos, haz lo siguiente:
-
Analista de Storage Insights (
roles/storageinsights.analyst) -
Administrador de BigQuery (
roles/bigquery.admin)
-
Analista de Storage Insights (
-
Para borrar conjuntos de datos vinculados, haz lo siguiente:
Administrador de BigQuery (
roles/bigquery.admin) -
Para ver y consultar conjuntos de datos en BigQuery, haz lo siguiente:
-
Visualizador de Storage Insights (
roles/storageinsights.viewer) -
Usuario de trabajo de BigQuery (
roles/bigquery.jobUser) -
Visualizador de datos de BigQuery (
roles/bigquery.dataViewer)
-
Visualizador de Storage Insights (
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Estos roles predefinidos contienen los permisos necesarios para administrar la configuración de los conjuntos de datos. Para ver los permisos exactos que son necesarios, expande la sección Permisos requeridos:
Permisos necesarios
Se requieren los siguientes permisos para administrar la configuración de conjuntos de datos:
-
Consulta y enumera la configuración del conjunto de datos:
-
storageinsights.datasetConfigs.get -
storageinsights.datasetConfigs.list -
storage.buckets.getObjectInsights
-
-
Actualiza y borra la configuración del conjunto de datos:
-
storageinsights.datasetConfigs.update -
storageinsights.datasetConfigs.delete -
storage.buckets.getObjectInsights
-
-
Desvincula el conjunto de datos de BigQuery:
storageinsights.datasetConfigs.unlinkDataset -
Consulta conjuntos de datos vinculados a BigQuery:
bigquery.jobs.create or bigquery.jobs.*
También puedes obtener estos permisos con roles personalizados o con otros roles predefinidos.
Visualiza y consulta conjuntos de datos vinculados
Para ver y consultar conjuntos de datos vinculados, sigue estos pasos:
- En la consola de Google Cloud , ve a la página Storage Insights de Cloud Storage.
En tu proyecto, se muestra una lista de las configuraciones de conjuntos de datos creadas.
Haz clic en el conjunto de datos vinculado a BigQuery para ver la configuración del conjunto de datos que desees.
La consola Google Cloud muestra el conjunto de datos vinculado a BigQuery. Para obtener información sobre el esquema de metadatos del conjunto de datos, consulta Esquema de metadatos del conjunto de datos.
Puedes consultar tablas y vistas en tus conjuntos de datos vinculados de la misma manera que consultarías cualquier otra tabla de BigQuery.
Desvincula un conjunto de datos
Para evitar que la configuración del conjunto de datos se publique en el conjunto de datos de BigQuery, desvincula el conjunto de datos. Para desvincular un conjunto de datos, completa los siguientes pasos:
Console
- En la consola de Google Cloud , ve a la página Storage Insights de Cloud Storage.
Haz clic en el nombre de la configuración del conjunto de datos que generó el conjunto de datos que deseas desvincular.
En la sección Conjunto de datos vinculado a BigQuery, haz clic en Desvincular conjunto de datos.
Línea de comandos
Para desvincular el conjunto de datos, ejecuta el comando
gcloud storage insights dataset-configs delete-link:gcloud storage insights dataset-configs delete-link DATASET_CONFIG_ID --location=LOCATION
Reemplaza lo siguiente:
DATASET_CONFIG_IDpor el nombre de la configuración del conjunto de datos que generó el conjunto de datos que deseas desvincular.LOCATIONcon la ubicación de tu conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.
También puedes especificar una ruta de acceso completa a la configuración del conjunto de datos. Por ejemplo:
gcloud storage insights dataset-configs delete-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Reemplaza lo siguiente:
DESTINATION_PROJECT_IDcon el ID del proyecto que contiene la configuración del conjunto de datos. Para obtener más información sobre los IDs de proyectos, consulta Crea y administra proyectos.DATASET_CONFIG_IDpor el nombre de la configuración del conjunto de datos que generó el conjunto de datos que deseas desvincular.LOCATIONcon la ubicación de tu conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.
API de JSON
Tener la gcloud CLI instalada e inicializada, lo que te permite generar un token de acceso para el encabezado
Authorization.Crea un archivo JSON que contenga la siguiente información:
{ "name": "DATASET_NAME" }
Reemplaza lo siguiente:
DATASET_NAMEpor el nombre del conjunto de datos que deseas desvincular. Por ejemplo:my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2Usa
cURLpara llamar a la API de JSON con una solicitud deunlinkDatasetDatasetConfig:curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID:unlinkDataset?" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Reemplaza lo siguiente:
JSON_FILE_NAMEpor la ruta de acceso al archivo JSON que creaste en el paso anterior.PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.DATASET_CONFIG_IDpor el nombre de la configuración del conjunto de datos que generó el conjunto de datos que deseas desvincular.SERVICE_ACCOUNTcon la cuenta de servicio Por ejemplo,test-service-account@test-project.iam.gserviceaccount.com
Cómo ver la configuración de un conjunto de datos
Para ver la configuración de un conjunto de datos, completa los siguientes pasos:
Console
- En la consola de Google Cloud , ve a la página Storage Insights de Cloud Storage.
Haz clic en el nombre de la configuración del conjunto de datos que deseas ver.
Se muestran los detalles de configuración del conjunto de datos.
Línea de comandos
Para describir la configuración de un conjunto de datos, ejecuta el comando
gcloud storage insights dataset-configs describe:gcloud storage insights dataset-configs describe DATASET_CONFIG_ID \ --location=LOCATION
Reemplaza lo siguiente:
DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datosLOCATIONcon la ubicación y la configuración del conjunto de datos.
También puedes especificar una ruta de acceso completa a la configuración del conjunto de datos. Por ejemplo:
gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Reemplaza lo siguiente:
DESTINATION_PROJECT_IDcon el ID del proyecto que contiene la configuración del conjunto de datos. Para obtener más información sobre los IDs de proyectos, consulta Crea y administra proyectos.DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datos que generó el conjunto de datos que deseas ver.LOCATIONcon la ubicación de tu conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.
API de JSON
Tener la gcloud CLI instalada e inicializada, lo que te permite generar un token de acceso para el encabezado
Authorization.Usa
cURLpara llamar a la API de JSON con una solicitud deGetDatasetConfig:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Reemplaza lo siguiente:
PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datosSERVICE_ACCOUNTcon la cuenta de servicio Por ejemplo,test-service-account@test-project.
Enumera las configuraciones del conjunto de datos
Para enumerar las configuraciones del conjunto de datos en un proyecto, completa los siguientes pasos:
Console
- En la consola de Google Cloud , ve a la página Storage Insights de Cloud Storage.
Se muestra la lista de configuraciones del conjunto de datos.
Línea de comandos
Para enumerar las configuraciones del conjunto de datos en un proyecto, ejecuta el comando
gcloud storage insights dataset-configs list:gcloud storage insights dataset-configs list --location=LOCATION
Reemplaza lo siguiente:
LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.
Puedes usar las siguientes marcas opcionales para especificar el comportamiento de la llamada a la lista:
Usa
--page-sizepara especificar la cantidad máxima de resultados que se devolverán por página.Usa
--filter=FILTERpara filtrar los resultados. Para obtener más información sobre cómo usar la marca--filter, ejecutagcloud topic filtersy consulta la documentación.Usa
--sort-by=SORT_BY_VALUEpara especificar una lista separada por comas de los nombres de claves de campo de recurso para ordenar. Por ejemplo,--sort-by=DATASET_CONFIG_ID
API de JSON
Tener la gcloud CLI instalada e inicializada, lo que te permite generar un token de acceso para el encabezado
Authorization.Usa
cURLpara llamar a la API de JSON con una solicitud deGetDatasetConfig:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Reemplaza lo siguiente:
PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.SERVICE_ACCOUNTcon la cuenta de servicio Por ejemplo,test-service-account@test-project.iam.gserviceaccount.com
Actualiza la configuración de un conjunto de datos
Para actualizar la configuración de un conjunto de datos, completa los siguientes pasos:
Console
- En la consola de Google Cloud , ve a la página Storage Insights de Cloud Storage.
Haz clic en el nombre de la configuración del conjunto de datos que deseas actualizar.
En la pestaña Configuración del conjunto de datos, haz clic en Editar para actualizar los campos.
Línea de comandos
Para actualizar la configuración de un conjunto de datos, ejecuta el comando
gcloud storage insights dataset-configs update:gcloud storage insights dataset-configs update DATASET_CONFIG_ID \ --location=LOCATION
Reemplaza lo siguiente:
DATASET_CONFIG_IDcon el nombre de la configuración del conjunto de datosLOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos.
Usa las siguientes marcas para actualizar las propiedades de la configuración del conjunto de datos:
Usa
--skip-verificationpara omitir las verificaciones y los errores del proceso de verificación, que incluye verificaciones de los permisos de IAM requeridos. Si se usa, es posible que se excluyan algunos o todos buckets del conjunto de datos.Usa
--retention-period-days=DAYSpara especificar la cantidad de días de datos móviles que se capturarán en la instantánea del conjunto de datos. Por ejemplo,90.Usa
--activity-data-retention-period-days=ACTIVITY_RETENTION_PERIOD_DAYSpara especificar el período de retención de los datos de actividad en el conjunto de datos. De forma predeterminada, los datos de actividad se incluyen en el conjunto de datos y heredan su período de retención. Para anular el período de retención del conjunto de datos, especifica la cantidad de días que se retendrán los datos de actividad. Para excluir los datos de actividad, establece ACTIVITY_RETENTION_PERIOD_DAYS en0.Usa
--description=DESCRIPTIONpara escribir una descripción de la configuración del conjunto de datos.Usa
--organization=ORGANIZATION_IDpara especificar el ID de la organización del proyecto de origen. Si no se especifica, el valor predeterminado es el ID de la organización del proyecto fuente.
API de JSON
Tener la gcloud CLI instalada e inicializada, lo que te permite generar un token de acceso para el encabezado
Authorization.Crea un archivo JSON que contenga la siguiente información opcional:
{ "organization_number": "ORGANIZATION_ID", "source_projects": { "project_numbers": "PROJECT_NUMBERS" }, "retention_period_days": "RETENTION_PERIOD", "activityDataRetentionPeriodDays": "ACTIVITY_DATA_RETENTION_PERIOD_DAYS" }
Reemplaza lo siguiente:
Reemplaza
ORGANIZATION_IDpor el ID del recurso de la organización a la que pertenecen los proyectos de origen. Si no se especifica, el valor predeterminado es el ID de la organización del proyecto fuente.PROJECT_NUMBERScon los números de proyecto que se incluirán en el conjunto de datos. Puedes especificar uno o más proyectos en formato de lista.RETENTION_PERIODcon la cantidad de días de datos móviles que se capturarán en la instantánea del conjunto de datos. Por ejemplo,90.ACTIVITY_DATA_RETENTION_PERIOD_DAYScon la cantidad de días de datos de actividad que se capturarán en la instantánea del conjunto de datos. De forma predeterminada, los datos de actividad se incluyen en el conjunto de datos y heredan su período de retención. Para anular el período de retención del conjunto de datos, especifica la cantidad de días que se retendrán los datos de actividad. Para excluir los datos de actividad, establece ACTIVITY_RETENTION_PERIOD_DAYS en0.
Para actualizar la configuración del conjunto de datos, usa
cURLpara llamar a la API de JSON con una solicitudPatchDatasetConfig:curl -X PATCH --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID?updateMask=UPDATE_MASK" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Reemplaza lo siguiente:
JSON_FILE_NAMEpor la ruta de acceso al archivo JSON que creaste en el paso anterior.PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.DATASET_CONFIG_IDpor el nombre de la configuración del conjunto de datos que deseas actualizar.UPDATE_MASKes la lista separada por comas de los nombres de campo que actualiza esta solicitud. Los campos usan el formato fieldMask y forman parte del recursoDatasetConfig.SERVICE_ACCOUNTcon la cuenta de servicio. Por ejemplo,test-service-account@test-project.iam.gserviceaccount.com.
Borra la configuración de un conjunto de datos
Para borrar la configuración de un conjunto de datos, completa los siguientes pasos:
Console
- En la consola de Google Cloud , ve a la página Storage Insights de Cloud Storage.
Haz clic en el nombre de la configuración del conjunto de datos que deseas borrar.
Haz clic en Borrar .
Línea de comandos
Para borrar una configuración del conjunto de datos, ejecuta el comando
gcloud storage insights dataset-configs delete:gcloud storage insights dataset-configs delete DATASET_CONFIG_ID \ --location=LOCATION
Reemplaza lo siguiente:
DATASET_CONFIG_IDpor el nombre de la configuración del conjunto de datos que deseas borrar.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.
Usa las siguientes marcas para borrar la configuración de un conjunto de datos:
- Usa
--auto-delete-linkpara desvincular el conjunto de datos que se generó a partir de la configuración del conjunto de datos que deseas borrar. Debes desvincular un conjunto de datos antes de poder borrar la configuración del conjunto de datos que lo generó.
También puedes especificar una ruta de acceso completa a la configuración del conjunto de datos. Por ejemplo:
gcloud storage insights dataset-configs delete projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
API de JSON
Tener la gcloud CLI instalada e inicializada, lo que te permite generar un token de acceso para el encabezado
Authorization.Usa
cURLpara llamar a la API de JSON con una solicitud deDeleteDatasetConfig:curl -X DELETE \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer $(gcloud auth print-access-token --impersonate-service-account=SERVICE_ACCOUNT)" \ --header "Accept: application/json" \ --header "Content-Type: application/json"Reemplaza lo siguiente:
PROJECT_IDcon el ID del proyecto al que pertenece la configuración del conjunto de datos.LOCATIONcon la ubicación del conjunto de datos y la configuración del conjunto de datos Por ejemplo,us-central1.DATASET_CONFIG_IDpor el nombre de la configuración del conjunto de datos que deseas borrar.SERVICE_ACCOUNTcon la cuenta de servicio Por ejemplo,test-service-account@test-project.iam.gserviceaccount.com
¿Qué sigue?
- Ver conjuntos de datos vinculados
- Consulta un conjunto de datos vinculado.
- Analiza tus datos almacenados con Gemini Cloud Assist.