Crea perfiles de datos

En este documento, se explica cómo usar los análisis de perfiles de datos para comprender mejor tus datos. BigQuery usa Dataplex Universal Catalog para analizar las características estadísticas de tus datos, como valores promedio, valores únicos y valores máximos. Dataplex Universal Catalog también usa esta información para recomendar reglas para las verificaciones de calidad de los datos.

Para obtener más información sobre la generación de perfiles de datos, consulta Acerca de la generación de perfiles de datos.

Antes de comenzar

Enable the Dataplex API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Roles obligatorios

Para obtener los permisos que necesitas para crear y administrar análisis de perfiles de datos, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu recurso, como el proyecto o la tabla:

  • Para crear, ejecutar, actualizar y borrar análisis de perfil de datos, debes tener el rol de Editor de DataScan de Dataplex (roles/dataplex.dataScanEditor) en el proyecto que contiene el análisis de datos.
  • Para permitir que Dataplex Universal Catalog ejecute análisis de perfiles de datos en los datos de BigQuery, otorga los siguientes roles a la cuenta de servicio de Dataplex Universal Catalog: Rol de usuario de trabajo de BigQuery (roles/bigquery.jobUser) en el proyecto que ejecuta el análisis; rol de visualizador de datos de BigQuery (roles/bigquery.dataViewer) en las tablas que se analizan.
  • Para ejecutar análisis de perfiles de datos en tablas externas de BigQuery que usan datos de Cloud Storage, haz lo siguiente: Otorga a la cuenta de servicio de Dataplex Universal Catalog los roles de Visualizador de objetos de Storage (roles/storage.objectViewer) y Lector de buckets heredados de Storage (roles/storage.legacyBucketReader) en el bucket de Cloud Storage.
  • Para ver los resultados, los trabajos y el historial del análisis de perfil de los datos, debes tener el rol de Visualizador de DataScan de Dataplex (roles/dataplex.dataScanViewer) en el proyecto que contiene el análisis de datos.
  • Para exportar los resultados del análisis del perfil de datos a una tabla de BigQuery, debes tener el rol de editor de datos de BigQuery (roles/bigquery.dataEditor) en la tabla.
  • Para publicar los resultados del análisis del perfil de datos en Dataplex Universal Catalog, debes tener el rol de Editor de Dataplex Catalog (roles/dataplex.catalogEditor) en el grupo de entradas @bigquery.
  • Para ver los resultados del análisis del perfil de datos publicados en BigQuery en la pestaña Perfil de datos, debes tener el rol de visualizador de datos de BigQuery (roles/bigquery.dataViewer) en la tabla.

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Permisos necesarios

Si usas roles personalizados, debes otorgar los siguientes permisos de IAM:

  • Para crear, ejecutar, actualizar y borrar análisis de perfiles de datos, otorga:
    • dataplex.datascans.create en el proyecto: Crea un DataScan
    • dataplex.datascans.update en el análisis de datos: Actualiza la descripción de un DataScan
    • dataplex.datascans.delete en el análisis de datos: Borra un DataScan
    • dataplex.datascans.run en el análisis de datos: Ejecuta un DataScan.
    • dataplex.datascans.get en el análisis de datos: Ve los detalles de DataScan, sin incluir los resultados
    • dataplex.datascans.list en el proyecto: Lista de DataScans
    • dataplex.dataScanJobs.get en el trabajo de análisis de datos: Lee los recursos del trabajo de DataScan
    • dataplex.dataScanJobs.list en el análisis de datos: Enumera los recursos de trabajos de DataScan en un proyecto
  • Para permitir que Dataplex Universal Catalog ejecute análisis de perfiles de datos en los datos de BigQuery, haz lo siguiente:
    • bigquery.jobs.create en el proyecto: Ejecuta trabajos
    • bigquery.tables.get en la tabla: Obtén metadatos de la tabla
    • bigquery.tables.getData en la tabla: Obtén datos de la tabla
  • Para ejecutar análisis de perfiles de datos en tablas externas de BigQuery que usan datos de Cloud Storage, haz lo siguiente:
    • storage.buckets.get en el bucket: Lee los metadatos del bucket
    • storage.objects.get en el objeto: Lee datos del objeto
  • Para ver los resultados, los trabajos y el historial del análisis de perfiles de datos, haz lo siguiente:
    • dataplex.datascans.getData en el análisis de datos: Consulta los detalles de DataScan, incluidos los resultados
    • dataplex.datascans.list en el proyecto: Lista de DataScans
    • dataplex.dataScanJobs.get en el trabajo de análisis de datos: Lee los recursos del trabajo de DataScan
    • dataplex.dataScanJobs.list en el análisis de datos: Enumera los recursos de trabajos de DataScan en un proyecto
  • Para exportar los resultados del análisis de perfil de datos a una tabla de BigQuery, sigue estos pasos:
    • bigquery.tables.create en el conjunto de datos: Crear tablas
    • bigquery.tables.updateData en la tabla: Escribe datos en las tablas
  • Para publicar los resultados del análisis del perfil de datos en Dataplex Universal Catalog, haz lo siguiente:
    • dataplex.entryGroups.useDataProfileAspect en el grupo de entradas: Permite que los análisis de perfiles de datos de Dataplex Universal Catalog guarden sus resultados en Dataplex Universal Catalog
    • Además, necesitas uno de los siguientes permisos:
      • bigquery.tables.update en la tabla: Actualiza los metadatos de la tabla.
      • dataplex.entries.update en la entrada: Actualizar entradas
  • Para ver los resultados del perfil de datos publicados de una tabla en BigQuery o Dataplex Universal Catalog, haz lo siguiente:
    • bigquery.tables.get en la tabla: Obtén metadatos de la tabla
    • bigquery.tables.getData en la tabla: Obtén datos de la tabla

Si una tabla usa la seguridad a nivel de la fila de BigQuery, Dataplex Universal Catalog solo puede analizar las filas visibles para la cuenta de servicio de Dataplex Universal Catalog. Para permitir que Dataplex Universal Catalog analice todas las filas, agrega su cuenta de servicio a un filtro de filas en el que el predicado sea TRUE.

Si una tabla usa la seguridad a nivel de columnas de BigQuery, Dataplex Universal Catalog requiere acceso para analizar las columnas protegidas. Para otorgar acceso, asigna a la cuenta de servicio de Dataplex Universal Catalog el rol de lector detallado de Data Catalog (roles/datacatalog.fineGrainedReader) en todas las etiquetas de política que se usan en la tabla. El usuario que crea o actualiza un análisis de datos también necesita permisos en las columnas protegidas.

Otorga roles a la cuenta de servicio de Dataplex Universal Catalog

Para ejecutar análisis de perfiles de datos, Dataplex Universal Catalog usa una cuenta de servicio que requiere permisos para ejecutar trabajos de BigQuery y leer datos de tablas de BigQuery. Para otorgar los roles obligatorios, sigue estos pasos:

  1. Obtén la dirección de correo electrónico de la cuenta de servicio de Dataplex Universal Catalog. Si no creaste un análisis de perfil de datos o de calidad de los datos en este proyecto antes, ejecuta el siguiente comando de gcloud para generar la identidad del servicio:

    gcloud beta services identity create --service=dataplex.googleapis.com
    

    El comando devuelve el correo electrónico de la cuenta de servicio, que tiene el siguiente formato: service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com.

    Si la cuenta de servicio ya existe, puedes encontrar su correo electrónico viendo los principales con el nombre Dataplex en la página de IAM en la consola de Google Cloud .

  2. Otorga a la cuenta de servicio el rol de Usuario de trabajo de BigQuery (roles/bigquery.jobUser) en tu proyecto. Este rol permite que la cuenta de servicio ejecute trabajos de BigQuery para la exploración.

    gcloud projects add-iam-policy-binding PROJECT_ID \
        --member="serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com" \
        --role="roles/bigquery.jobUser"
    

    Reemplaza lo siguiente:

    • PROJECT_ID: El ID de tu proyecto Google Cloud .
    • service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com: Es el correo electrónico de la cuenta de servicio de Dataplex Universal Catalog.
  3. Otorga a la cuenta de servicio el rol de visualizador de datos de BigQuery (roles/bigquery.dataViewer) para cada tabla que desees crear perfiles. Este rol otorga acceso de solo lectura a las tablas.

    gcloud bigquery tables add-iam-policy-binding DATASET_ID.TABLE_ID \
        --member="serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com" \
        --role="roles/bigquery.dataViewer"
    

    Reemplaza lo siguiente:

    • DATASET_ID: Es el ID del conjunto de datos que contiene la tabla.
    • TABLE_ID: Es el ID de la tabla para la que se generará el perfil.
    • service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com: Es el correo electrónico de la cuenta de servicio de Dataplex Universal Catalog.

      Crea un análisis de perfil de datos

      Console

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en Crear análisis del perfil de datos.

      3. Opcional: Ingresa un nombre visible.

      4. Ingresa un ID. Consulta las convenciones de nomenclatura de recursos.

      5. Escribe una descripción (opcional).

      6. En el campo Tabla, haz clic en Explorar. Elige la tabla que deseas analizar y, luego, haz clic en Seleccionar.

        Para las tablas en conjuntos de datos multirregionales, elige una región en la que se creará el análisis de datos.

        Para explorar las tablas organizadas en los data lakes de Dataplex Universal Catalog, haz clic en Browse within Dataplex Lakes.

      7. En el campo Alcance, elige Incremental o Datos completos.

        • Si eliges Datos incrementales, en el campo Columna de marca de tiempo, selecciona una columna de tipo DATE o TIMESTAMP de tu tabla de BigQuery que aumente a medida que se agreguen registros nuevos y que se pueda usar para identificar registros nuevos. Para las tablas particionadas en una columna de tipo DATE o TIMESTAMP, recomendamos usar la columna de partición como el campo de marca de tiempo.
      8. Opcional: Para filtrar tus datos, haz cualquiera de las siguientes acciones:

        • Para filtrar por filas, haz clic en la casilla de verificación Filtrar filas. Ingresa una expresión de SQL válida que se pueda usar en una cláusula WHERE en la sintaxis de GoogleSQL. Por ejemplo: col1 >= 0.

          El filtro puede ser una combinación de condiciones de SQL en varias columnas. Por ejemplo: col1 >= 0 AND col2 < 10.

        • Para filtrar por columnas, selecciona la casilla de verificación Filtrar columnas.

          • Para incluir columnas en el análisis del perfil, en el campo Incluir columnas, haz clic en Explorar. Selecciona las columnas que deseas incluir y, luego, haz clic en Seleccionar.

          • Para excluir columnas del análisis del perfil, en el campo Exclude columns, haz clic en Browse. Selecciona las columnas que deseas excluir y, luego, haz clic en Seleccionar.

      9. Para aplicar el muestreo al análisis del perfil de datos, selecciona un porcentaje de muestreo en la lista Tamaño de muestreo. Elige un valor de porcentaje que oscile entre el 0.0% y el 100.0% con hasta 3 dígitos decimales.

        • Para conjuntos de datos más grandes, elige un porcentaje de muestreo más bajo. Por ejemplo, para una tabla de 1 PB, si ingresas un valor entre el 0.1% y el 1.0%, el perfil de datos muestreará entre 1 y 10 TB de datos.

        • Debe haber al menos 100 registros en los datos de la muestra para devolver un resultado.

        • Para los análisis de datos incrementales, el análisis del perfil de datos aplica el muestreo al incremento más reciente.

      10. Opcional: Publica los resultados del análisis del perfil de datos en las páginas de BigQuery y Dataplex Universal Catalog en la consola deGoogle Cloud para la tabla de origen. Selecciona la casilla de verificación Publicar los resultados en BigQuery y Dataplex Catalog.

        Puedes ver los resultados del análisis más recientes en la pestaña Perfil de datos de las páginas de BigQuery y Dataplex Universal Catalog de la tabla de origen. Para permitir que los usuarios accedan a los resultados del análisis publicados, consulta la sección Otorga acceso a los resultados del análisis de perfil de datos de este documento.

        Es posible que la opción de publicación no esté disponible en los siguientes casos:

        • No tienes los permisos necesarios en la tabla.
        • Otro análisis de calidad de los datos está configurado para publicar resultados.
      11. En la sección Programación, elige una de las siguientes opciones:

        • Repetir: Ejecuta el análisis del perfil de datos según un programa: por hora, diario, semanal, mensual o personalizado. Especifica la frecuencia con la que se debe ejecutar el análisis y a qué hora. Si eliges la opción personalizada, usa el formato cron para especificar la programación.

        • On demand: Ejecuta el análisis del perfil de datos según demanda.

      12. Haz clic en Continuar.

      13. Opcional: Exporta los resultados del análisis a una tabla estándar de BigQuery. En la sección Export scan results to BigQuery table, haz lo siguiente:

        1. En el campo Selecciona un conjunto de datos de BigQuery, haz clic en Explorar. Selecciona un conjunto de datos de BigQuery para almacenar los resultados del análisis del perfil de datos.

        2. En el campo Tabla de BigQuery, especifica la tabla en la que se almacenarán los resultados del análisis del perfil de datos. Si usas una tabla existente, asegúrate de que sea compatible con el esquema de la tabla de exportación. Si la tabla especificada no existe, Dataplex Universal Catalog la crea por ti.

      14. Opcional: Agrega etiquetas. Las etiquetas son pares clave-valor que te permiten agrupar objetos relacionados entre sí o con otros recursos de Google Cloud .

      15. Para crear el análisis, haz clic en Crear.

        Si configuras el programa como a pedido, también puedes ejecutar el análisis ahora haciendo clic en Ejecutar análisis.

      gcloud

      Para crear un análisis del perfil de datos, usa el comando gcloud dataplex datascans create data-profile.

      Si los datos de origen están organizados en un lake de Dataplex Universal Catalog, incluye la marca --data-source-entity:

      gcloud dataplex datascans create data-profile DATASCAN \
      --location=LOCATION \
      --data-source-entity=DATA_SOURCE_ENTITY
      

      Si los datos de origen no están organizados en un lake de Dataplex Universal Catalog, incluye la marca --data-source-resource:

      gcloud dataplex datascans create data-profile DATASCAN \
      --location=LOCATION \
      --data-source-resource=DATA_SOURCE_RESOURCE
      

      Reemplaza las siguientes variables:

      • DATASCAN: Es el nombre del análisis del perfil de datos.
      • LOCATION: Es la región Google Cloud en la que se creará el análisis del perfil de datos.
      • DATA_SOURCE_ENTITY: Es la entidad de Dataplex Universal Catalog que contiene los datos para el análisis del perfil de datos. Por ejemplo, projects/test-project/locations/test-location/lakes/test-lake/zones/test-zone/entities/test-entity
      • DATA_SOURCE_RESOURCE: Es el nombre del recurso que contiene los datos para el análisis del perfil de datos. Por ejemplo, //bigquery.googleapis.com/projects/test-project/datasets/test-dataset/tables/test-table

      C#

      C#

      Antes de probar este ejemplo, sigue las instrucciones de configuración para C# que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de C# de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      using Google.Api.Gax.ResourceNames;
      using Google.Cloud.Dataplex.V1;
      using Google.LongRunning;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for CreateDataScan</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void CreateDataScanRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              CreateDataScanRequest request = new CreateDataScanRequest
              {
                  ParentAsLocationName = LocationName.FromProjectLocation("[PROJECT]", "[LOCATION]"),
                  DataScan = new DataScan(),
                  DataScanId = "",
                  ValidateOnly = false,
              };
              // Make the request
              Operation<DataScan, OperationMetadata> response = dataScanServiceClient.CreateDataScan(request);
      
              // Poll until the returned long-running operation is complete
              Operation<DataScan, OperationMetadata> completedResponse = response.PollUntilCompleted();
              // Retrieve the operation result
              DataScan result = completedResponse.Result;
      
              // Or get the name of the operation
              string operationName = response.Name;
              // This name can be stored, then the long-running operation retrieved later by name
              Operation<DataScan, OperationMetadata> retrievedResponse = dataScanServiceClient.PollOnceCreateDataScan(operationName);
              // Check if the retrieved long-running operation has completed
              if (retrievedResponse.IsCompleted)
              {
                  // If it has completed, then access the result
                  DataScan retrievedResult = retrievedResponse.Result;
              }
          }
      }

      Go

      Go

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Go que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Go de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.CreateDataScanRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#CreateDataScanRequest.
      	}
      	op, err := c.CreateDataScan(ctx, req)
      	if err != nil {
      		// TODO: Handle error.
      	}
      
      	resp, err := op.Wait(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	// TODO: Use resp.
      	_ = resp
      }
      

      Java

      Java

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Java que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Java de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      import com.google.cloud.dataplex.v1.CreateDataScanRequest;
      import com.google.cloud.dataplex.v1.DataScan;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.LocationName;
      
      public class SyncCreateDataScan {
      
        public static void main(String[] args) throws Exception {
          syncCreateDataScan();
        }
      
        public static void syncCreateDataScan() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            CreateDataScanRequest request =
                CreateDataScanRequest.newBuilder()
                    .setParent(LocationName.of("[PROJECT]", "[LOCATION]").toString())
                    .setDataScan(DataScan.newBuilder().build())
                    .setDataScanId("dataScanId1260787906")
                    .setValidateOnly(true)
                    .build();
            DataScan response = dataScanServiceClient.createDataScanAsync(request).get();
          }
        }
      }

      Python

      Python

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Python que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Python de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_create_data_scan():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          data_scan = dataplex_v1.DataScan()
          data_scan.data_quality_spec.rules.dimension = "dimension_value"
          data_scan.data.entity = "entity_value"
      
          request = dataplex_v1.CreateDataScanRequest(
              parent="parent_value",
              data_scan=data_scan,
              data_scan_id="data_scan_id_value",
          )
      
          # Make the request
          operation = client.create_data_scan(request=request)
      
          print("Waiting for operation to complete...")
      
          response = operation.result()
      
          # Handle the response
          print(response)
      
      

      Ruby

      Ruby

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Ruby que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Ruby de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the create_data_scan call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#create_data_scan.
      #
      def create_data_scan
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::CreateDataScanRequest.new
      
        # Call the create_data_scan method.
        result = client.create_data_scan request
      
        # The returned object is of type Gapic::Operation. You can use it to
        # check the status of an operation, cancel it, or wait for results.
        # Here is how to wait for a response.
        result.wait_until_done! timeout: 60
        if result.response?
          p result.response
        else
          puts "No response received."
        end
      end

      REST

      Para crear un análisis del perfil de datos, usa el método dataScans.create.

      Crear varios análisis de perfiles de datos

      Puedes configurar análisis de perfil de datos para varias tablas en un conjunto de datos de BigQuery al mismo tiempo con la consola de Google Cloud .

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en Crear análisis del perfil de datos.

      3. Selecciona la opción Varios análisis del perfil de datos.

      4. Ingresa un prefijo de ID. Dataplex Universal Catalog genera automáticamente IDs de análisis con el prefijo proporcionado y sufijos únicos.

      5. Ingresa una Descripción para todos los análisis del perfil de datos.

      6. En el campo Conjunto de datos, haz clic en Explorar. Selecciona un conjunto de datos para elegir tablas. Haz clic en Seleccionar.

      7. Si el conjunto de datos es multirregional, selecciona una región en la que crear los análisis de perfiles de datos.

      8. Establece la configuración común para los análisis:

        1. En el campo Alcance, elige Incremental o Datos completos.

        2. Para aplicar el muestreo a los análisis de perfiles de datos, en la lista Tamaño de muestreo, selecciona un porcentaje de muestreo.

          Elige un valor de porcentaje entre 0.0% y 100.0% con hasta 3 dígitos decimales.

        3. Opcional: Publica los resultados del análisis del perfil de datos en las páginas de BigQuery y Dataplex Universal Catalog en la consola deGoogle Cloud para la tabla de origen. Selecciona la casilla de verificación Publicar los resultados en BigQuery y Dataplex Catalog.

          Puedes ver los resultados del análisis más recientes en la pestaña Perfil de datos en las páginas de BigQuery y Dataplex Universal Catalog de la tabla de origen. Para permitir que los usuarios accedan a los resultados del análisis publicados, consulta la sección Otorga acceso a los resultados del análisis del perfil de datos de este documento.

        4. En la sección Programación, elige una de las siguientes opciones:

          • Repetir: Ejecuta los análisis de perfil de datos según un programa: por hora, diario, semanal, mensual o personalizado. Especifica con qué frecuencia y a qué hora se deben ejecutar los análisis. Si eliges la opción personalizada, usa el formato cron para especificar la programación.

          • A pedido: Ejecuta los análisis del perfil de datos a pedido.

      9. Haz clic en Continuar.

      10. En el campo Elegir tablas, haz clic en Explorar. Elige una o más tablas para analizar y, luego, haz clic en Seleccionar.

      11. Haz clic en Continuar.

      12. Opcional: Exporta los resultados del análisis a una tabla estándar de BigQuery. En la sección Export scan results to BigQuery table, haz lo siguiente:

        1. En el campo Selecciona un conjunto de datos de BigQuery, haz clic en Explorar. Selecciona un conjunto de datos de BigQuery para almacenar los resultados del análisis del perfil de datos.

        2. En el campo Tabla de BigQuery, especifica la tabla en la que se almacenarán los resultados del análisis del perfil de datos. Si usas una tabla existente, asegúrate de que sea compatible con el esquema de la tabla de exportación. Si la tabla especificada no existe, Dataplex Universal Catalog la crea por ti.

          Dataplex Universal Catalog usa la misma tabla de resultados para todos los análisis de perfil de datos.

      13. Opcional: Agrega etiquetas. Las etiquetas son pares clave-valor que te permiten agrupar objetos relacionados entre sí o con otros recursos de Google Cloud .

      14. Para crear los análisis, haz clic en Crear.

        Si configuras la programación a pedido, también puedes ejecutar los análisis ahora haciendo clic en Ejecutar análisis.

      Ejecuta un análisis de perfil de datos

      Console

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en el análisis del perfil de datos que deseas ejecutar.
      3. Haz clic en Ejecutar ahora.

      gcloud

      Para ejecutar un análisis de perfil de datos, usa el comando gcloud dataplex datascans run:

      gcloud dataplex datascans run DATASCAN \
      --location=LOCATION
      

      Reemplaza las siguientes variables:

      • DATASCAN: Es el nombre del análisis del perfil de datos.
      • LOCATION: Es la Google Cloud región en la que se creó el análisis del perfil de datos.

      C#

      C#

      Antes de probar este ejemplo, sigue las instrucciones de configuración para C# que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de C# de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      using Google.Cloud.Dataplex.V1;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for RunDataScan</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void RunDataScanRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              RunDataScanRequest request = new RunDataScanRequest
              {
                  DataScanName = DataScanName.FromProjectLocationDataScan("[PROJECT]", "[LOCATION]", "[DATASCAN]"),
              };
              // Make the request
              RunDataScanResponse response = dataScanServiceClient.RunDataScan(request);
          }
      }

      Go

      Go

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Go que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Go de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.RunDataScanRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#RunDataScanRequest.
      	}
      	resp, err := c.RunDataScan(ctx, req)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	// TODO: Use resp.
      	_ = resp
      }
      

      Java

      Java

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Java que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Java de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      import com.google.cloud.dataplex.v1.DataScanName;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.RunDataScanRequest;
      import com.google.cloud.dataplex.v1.RunDataScanResponse;
      
      public class SyncRunDataScan {
      
        public static void main(String[] args) throws Exception {
          syncRunDataScan();
        }
      
        public static void syncRunDataScan() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            RunDataScanRequest request =
                RunDataScanRequest.newBuilder()
                    .setName(DataScanName.of("[PROJECT]", "[LOCATION]", "[DATASCAN]").toString())
                    .build();
            RunDataScanResponse response = dataScanServiceClient.runDataScan(request);
          }
        }
      }

      Python

      Python

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Python que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Python de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_run_data_scan():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          request = dataplex_v1.RunDataScanRequest(
              name="name_value",
          )
      
          # Make the request
          response = client.run_data_scan(request=request)
      
          # Handle the response
          print(response)
      
      

      Ruby

      Ruby

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Ruby que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Ruby de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the run_data_scan call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#run_data_scan.
      #
      def run_data_scan
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::RunDataScanRequest.new
      
        # Call the run_data_scan method.
        result = client.run_data_scan request
      
        # The returned object is of type Google::Cloud::Dataplex::V1::RunDataScanResponse.
        p result
      end

      REST

      Para ejecutar un análisis de perfil de datos, usa el método dataScans.run.

      Visualiza los resultados del análisis de perfiles de datos

      Console

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en el nombre de un análisis del perfil de datos.

        • En la sección Descripción general, se muestra información sobre los trabajos más recientes, como cuándo se ejecutó el análisis, la cantidad de registros de la tabla analizados y el estado del trabajo.

        • En la sección Configuración del análisis del perfil de datos, se muestran detalles sobre el análisis.

      3. Para ver información detallada sobre un trabajo, como las columnas de la tabla analizada, las estadísticas sobre las columnas que se encontraron en el análisis y los registros del trabajo, haz clic en la pestaña Historial de trabajos. Luego, haz clic en un ID de trabajo.

      gcloud

      Para ver los resultados de un trabajo de análisis de perfil de datos, usa el comando gcloud dataplex datascans jobs describe:

      gcloud dataplex datascans jobs describe JOB \
      --location=LOCATION \
      --datascan=DATASCAN \
      --view=FULL
      

      Reemplaza las siguientes variables:

      • JOB: Es el ID del trabajo de análisis del perfil de datos.
      • LOCATION: Es la Google Cloud región en la que se creó el análisis del perfil de datos.
      • DATASCAN: Es el nombre del análisis del perfil de datos al que pertenece el trabajo.
      • --view=FULL: Para ver el resultado del trabajo de análisis, especifica FULL.

      C#

      C#

      Antes de probar este ejemplo, sigue las instrucciones de configuración para C# que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de C# de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      using Google.Cloud.Dataplex.V1;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for GetDataScan</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void GetDataScanRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              GetDataScanRequest request = new GetDataScanRequest
              {
                  DataScanName = DataScanName.FromProjectLocationDataScan("[PROJECT]", "[LOCATION]", "[DATASCAN]"),
                  View = GetDataScanRequest.Types.DataScanView.Unspecified,
              };
              // Make the request
              DataScan response = dataScanServiceClient.GetDataScan(request);
          }
      }

      Go

      Go

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Go que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Go de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.GetDataScanRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#GetDataScanRequest.
      	}
      	resp, err := c.GetDataScan(ctx, req)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	// TODO: Use resp.
      	_ = resp
      }
      

      Java

      Java

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Java que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Java de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      import com.google.cloud.dataplex.v1.DataScan;
      import com.google.cloud.dataplex.v1.DataScanName;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.GetDataScanRequest;
      
      public class SyncGetDataScan {
      
        public static void main(String[] args) throws Exception {
          syncGetDataScan();
        }
      
        public static void syncGetDataScan() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            GetDataScanRequest request =
                GetDataScanRequest.newBuilder()
                    .setName(DataScanName.of("[PROJECT]", "[LOCATION]", "[DATASCAN]").toString())
                    .build();
            DataScan response = dataScanServiceClient.getDataScan(request);
          }
        }
      }

      Python

      Python

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Python que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Python de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_get_data_scan():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          request = dataplex_v1.GetDataScanRequest(
              name="name_value",
          )
      
          # Make the request
          response = client.get_data_scan(request=request)
      
          # Handle the response
          print(response)
      
      

      Ruby

      Ruby

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Ruby que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Ruby de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the get_data_scan call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#get_data_scan.
      #
      def get_data_scan
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::GetDataScanRequest.new
      
        # Call the get_data_scan method.
        result = client.get_data_scan request
      
        # The returned object is of type Google::Cloud::Dataplex::V1::DataScan.
        p result
      end

      REST

      Para ver los resultados de un análisis de perfil de los datos, usa el método dataScans.get.

      Visualiza los resultados publicados

      Si los resultados del análisis del perfil de datos se publican en las páginas de BigQuery y Dataplex Universal Catalog en la consola de Google Cloud , puedes ver los resultados del análisis más recientes en la pestaña Perfil de datos de la tabla de origen.

      1. En la consola de Google Cloud , ve a la página BigQuery.

        Ir a BigQuery

      2. En el panel de la izquierda, haz clic en Explorar:

        Botón destacado del panel Explorador.

        Si no ves el panel izquierdo, haz clic en Expandir panel izquierdo para abrirlo.

      3. En el panel Explorador, haz clic en Conjuntos de datos y, luego, en tu conjunto de datos.

      4. Haz clic en Resumen > Tablas y, luego, selecciona la tabla cuyos resultados del análisis de perfil de los datos deseas ver.

      5. Haz clic en la pestaña Perfil de datos.

        Se muestran los resultados publicados más recientes.

      Cómo ver el trabajo de análisis de perfil de datos más reciente

      Console

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en el nombre de un análisis del perfil de datos.

      3. Haz clic en la pestaña Resultados del trabajo más reciente.

        La pestaña Resultados del trabajo más reciente, cuando hay al menos una ejecución completada correctamente, proporciona información sobre el trabajo más reciente. En ella, se enumeran las columnas de la tabla analizada y las estadísticas sobre las columnas que se encontraron en el análisis.

      gcloud

      Para ver el análisis de perfil de datos exitoso más reciente, usa el comando gcloud dataplex datascans describe:

      gcloud dataplex datascans describe DATASCAN \
      --location=LOCATION \
      --view=FULL
      

      Reemplaza las siguientes variables:

      • DATASCAN: Es el nombre del análisis del perfil de datos para el que se desea ver el trabajo más reciente.
      • LOCATION: Es la región de Google Cloud en la que se creó el análisis del perfil de datos.
      • --view=FULL: Para ver el resultado del trabajo de análisis, especifica FULL.

      REST

      Para ver el trabajo de análisis más reciente, usa el método dataScans.get.

      Visualiza los resultados del análisis histórico

      Dataplex Universal Catalog guarda el historial de análisis de perfil de datos de los últimos 300 trabajos o del último año, lo que ocurra primero.

      Console

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en el nombre de un análisis del perfil de datos.

      3. Haz clic en la pestaña Historial de trabajos.

        La pestaña Historial de trabajos proporciona información sobre los trabajos anteriores, como la cantidad de registros analizados en cada trabajo, el estado del trabajo y la hora en que se ejecutó.

      4. Para ver información detallada sobre un trabajo, haz clic en cualquiera de los trabajos de la columna ID del trabajo.

      gcloud

      Para ver los trabajos históricos de análisis de perfiles de datos, usa el comando gcloud dataplex datascans jobs list:

      gcloud dataplex datascans jobs list \
      --location=LOCATION \
      --datascan=DATASCAN
      

      Reemplaza las siguientes variables:

      • LOCATION: Es la región de Google Cloud en la que se creó el análisis del perfil de datos.
      • DATASCAN: Es el nombre del análisis del perfil de datos para el que se visualizarán los trabajos.

      C#

      C#

      Antes de probar este ejemplo, sigue las instrucciones de configuración para C# que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de C# de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      using Google.Api.Gax;
      using Google.Cloud.Dataplex.V1;
      using System;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for ListDataScanJobs</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void ListDataScanJobsRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              ListDataScanJobsRequest request = new ListDataScanJobsRequest
              {
                  ParentAsDataScanName = DataScanName.FromProjectLocationDataScan("[PROJECT]", "[LOCATION]", "[DATASCAN]"),
                  Filter = "",
              };
              // Make the request
              PagedEnumerable<ListDataScanJobsResponse, DataScanJob> response = dataScanServiceClient.ListDataScanJobs(request);
      
              // Iterate over all response items, lazily performing RPCs as required
              foreach (DataScanJob item in response)
              {
                  // Do something with each item
                  Console.WriteLine(item);
              }
      
              // Or iterate over pages (of server-defined size), performing one RPC per page
              foreach (ListDataScanJobsResponse page in response.AsRawResponses())
              {
                  // Do something with each page of items
                  Console.WriteLine("A page of results:");
                  foreach (DataScanJob item in page)
                  {
                      // Do something with each item
                      Console.WriteLine(item);
                  }
              }
      
              // Or retrieve a single page of known size (unless it's the final page), performing as many RPCs as required
              int pageSize = 10;
              Page<DataScanJob> singlePage = response.ReadPage(pageSize);
              // Do something with the page of items
              Console.WriteLine($"A page of {pageSize} results (unless it's the final page):");
              foreach (DataScanJob item in singlePage)
              {
                  // Do something with each item
                  Console.WriteLine(item);
              }
              // Store the pageToken, for when the next page is required.
              string nextPageToken = singlePage.NextPageToken;
          }
      }

      Go

      Go

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Go que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Go de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      	"google.golang.org/api/iterator"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.ListDataScanJobsRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#ListDataScanJobsRequest.
      	}
      	it := c.ListDataScanJobs(ctx, req)
      	for {
      		resp, err := it.Next()
      		if err == iterator.Done {
      			break
      		}
      		if err != nil {
      			// TODO: Handle error.
      		}
      		// TODO: Use resp.
      		_ = resp
      
      		// If you need to access the underlying RPC response,
      		// you can do so by casting the `Response` as below.
      		// Otherwise, remove this line. Only populated after
      		// first call to Next(). Not safe for concurrent access.
      		_ = it.Response.(*dataplexpb.ListDataScanJobsResponse)
      	}
      }
      

      Java

      Java

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Java que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Java de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      import com.google.cloud.dataplex.v1.DataScanJob;
      import com.google.cloud.dataplex.v1.DataScanName;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.ListDataScanJobsRequest;
      
      public class SyncListDataScanJobs {
      
        public static void main(String[] args) throws Exception {
          syncListDataScanJobs();
        }
      
        public static void syncListDataScanJobs() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            ListDataScanJobsRequest request =
                ListDataScanJobsRequest.newBuilder()
                    .setParent(DataScanName.of("[PROJECT]", "[LOCATION]", "[DATASCAN]").toString())
                    .setPageSize(883849137)
                    .setPageToken("pageToken873572522")
                    .setFilter("filter-1274492040")
                    .build();
            for (DataScanJob element : dataScanServiceClient.listDataScanJobs(request).iterateAll()) {
              // doThingsWith(element);
            }
          }
        }
      }

      Python

      Python

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Python que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Python de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_list_data_scan_jobs():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          request = dataplex_v1.ListDataScanJobsRequest(
              parent="parent_value",
          )
      
          # Make the request
          page_result = client.list_data_scan_jobs(request=request)
      
          # Handle the response
          for response in page_result:
              print(response)
      
      

      Ruby

      Ruby

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Ruby que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Ruby de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the list_data_scan_jobs call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#list_data_scan_jobs.
      #
      def list_data_scan_jobs
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::ListDataScanJobsRequest.new
      
        # Call the list_data_scan_jobs method.
        result = client.list_data_scan_jobs request
      
        # The returned object is of type Gapic::PagedEnumerable. You can iterate
        # over elements, and API calls will be issued to fetch pages as needed.
        result.each do |item|
          # Each element is of type ::Google::Cloud::Dataplex::V1::DataScanJob.
          p item
        end
      end

      REST

      Para ver los trabajos históricos de análisis de perfil de los datos, usa el método dataScans.jobs.list.

      Visualiza los análisis de perfil de datos de una tabla

      Para ver los análisis del perfil de datos que se aplican a una tabla específica, haz lo siguiente:

      1. En la consola de Google Cloud , en la página Curación de metadatos de BigQuery, ve a la pestaña Generación de perfiles de datos y calidad.

        Ir a Creación de perfiles de datos y calidad

      2. Filtra la lista por nombre de tabla y tipo de análisis.

      Otorga acceso a los resultados del análisis de perfil de datos

      Para permitir que los usuarios de tu organización vean los resultados del análisis, haz lo siguiente:

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en el análisis de calidad de los datos cuyos resultados quieras compartir.

      3. Haz clic en la pestaña Permisos.

      4. Haz lo siguiente:

        • Para otorgar acceso a una principal, haz clic en Otorgar acceso. Otorga el rol Visualizador de datos de DataScan de Dataplex a la principal asociada.
        • Para quitar el acceso de una principal, selecciona la principal de la que deseas quitar el rol Visualizador de datos de DataScan de Dataplex. Haz clic en Quitar acceso y, luego, confirma la acción cuando se te solicite.

      Administra los análisis de perfil de datos para una tabla específica

      En los pasos de este documento, se muestra cómo administrar los análisis de perfiles de datos en tu proyecto con la página Curación de metadatos > Generación de perfiles de datos y calidad de BigQuery en la consola deGoogle Cloud .

      También puedes crear y administrar análisis de perfiles de datos cuando trabajas con una tabla específica. En la consola de Google Cloud , en la página de BigQuery para la tabla, usa la pestaña Perfil de datos. Haz lo siguiente:

      1. En la consola de Google Cloud , ve a la página BigQuery.

        Ir a BigQuery

        En el panel Explorador (en el panel izquierdo), haz clic en Conjuntos de datos y, luego, en tu conjunto de datos. Ahora, haz clic en Overview > Tables y selecciona la tabla cuyos resultados del análisis de perfil de datos deseas ver.

      2. Haz clic en la pestaña Perfil de datos.

      3. Según si la tabla tiene un análisis de perfil de datos cuyos resultados se publicaron, puedes trabajar con los análisis de perfil de datos de la tabla de las siguientes maneras:

        • Se publicaron los resultados del análisis de perfil de datos: En la página, se muestran los resultados del análisis publicado más reciente.

          Para administrar los análisis de perfil de los datos de esta tabla, haz clic en Análisis de perfil de los datos y, luego, selecciona una de las siguientes opciones:

          • Crear análisis nuevo: Crea un análisis de perfil de datos nuevo. Para obtener más información, consulta la sección Crea un análisis del perfil de datos de este documento. Cuando creas un análisis desde la página de detalles de una tabla, esta se preselecciona.

          • Ejecutar ahora: Ejecuta el análisis.

          • Editar configuración de análisis: Edita la configuración, incluido el nombre visible, los filtros, el tamaño de la muestra y la programación.

          • Administrar permisos del análisis: Controla quién puede acceder a los resultados del análisis. Para obtener más información, consulta la sección Otorga acceso a los resultados del análisis de perfil de los datos de este documento.

          • Ver resultados históricos: Consulta información detallada sobre los trabajos de análisis de perfiles de datos anteriores. Para obtener más información, consulta las secciones Visualiza los resultados del análisis de perfiles de datos y Visualiza los resultados históricos del análisis de este documento.

          • Ver todos los análisis: Consulta una lista de los análisis de perfil de los datos que se aplican a esta tabla.

        • Los resultados del análisis de perfil de datos no se publican: Haz clic en el menú junto a Perfil de datos rápido y, luego, selecciona una de las siguientes opciones:

          • Personaliza la generación de perfiles de datos: Crea un nuevo análisis del perfil de datos. Para obtener más información, consulta la sección Crea un análisis del perfil de datos de este documento. Cuando creas un análisis desde la página de detalles de una tabla, esta se preselecciona.

          • Ver perfiles anteriores: Consulta una lista de los análisis de perfil de los datos que se aplican a esta tabla.

      Actualiza un análisis del perfil de datos

      Console

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en el nombre de un análisis del perfil de datos.

      3. Haz clic en Editar y, luego, edita los valores.

      4. Haz clic en Guardar.

      gcloud

      Para actualizar un análisis del perfil de datos, usa el comando gcloud dataplex datascans update data-profile:

      gcloud dataplex datascans update data-profile DATASCAN \
      --location=LOCATION \
      --description=DESCRIPTION
      

      Reemplaza las siguientes variables:

      • DATASCAN: Es el nombre del análisis del perfil de datos que se actualizará.
      • LOCATION: Es la región de Google Cloud en la que se creó el análisis del perfil de datos.
      • DESCRIPTION: Es la nueva descripción del análisis del perfil de datos.

      C#

      C#

      Antes de probar este ejemplo, sigue las instrucciones de configuración para C# que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de C# de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      using Google.Cloud.Dataplex.V1;
      using Google.LongRunning;
      using Google.Protobuf.WellKnownTypes;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for UpdateDataScan</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void UpdateDataScanRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              UpdateDataScanRequest request = new UpdateDataScanRequest
              {
                  DataScan = new DataScan(),
                  UpdateMask = new FieldMask(),
                  ValidateOnly = false,
              };
              // Make the request
              Operation<DataScan, OperationMetadata> response = dataScanServiceClient.UpdateDataScan(request);
      
              // Poll until the returned long-running operation is complete
              Operation<DataScan, OperationMetadata> completedResponse = response.PollUntilCompleted();
              // Retrieve the operation result
              DataScan result = completedResponse.Result;
      
              // Or get the name of the operation
              string operationName = response.Name;
              // This name can be stored, then the long-running operation retrieved later by name
              Operation<DataScan, OperationMetadata> retrievedResponse = dataScanServiceClient.PollOnceUpdateDataScan(operationName);
              // Check if the retrieved long-running operation has completed
              if (retrievedResponse.IsCompleted)
              {
                  // If it has completed, then access the result
                  DataScan retrievedResult = retrievedResponse.Result;
              }
          }
      }

      Go

      Go

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Go que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Go de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.UpdateDataScanRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#UpdateDataScanRequest.
      	}
      	op, err := c.UpdateDataScan(ctx, req)
      	if err != nil {
      		// TODO: Handle error.
      	}
      
      	resp, err := op.Wait(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	// TODO: Use resp.
      	_ = resp
      }
      

      Java

      Java

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Java que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Java de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      import com.google.cloud.dataplex.v1.DataScan;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.UpdateDataScanRequest;
      import com.google.protobuf.FieldMask;
      
      public class SyncUpdateDataScan {
      
        public static void main(String[] args) throws Exception {
          syncUpdateDataScan();
        }
      
        public static void syncUpdateDataScan() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            UpdateDataScanRequest request =
                UpdateDataScanRequest.newBuilder()
                    .setDataScan(DataScan.newBuilder().build())
                    .setUpdateMask(FieldMask.newBuilder().build())
                    .setValidateOnly(true)
                    .build();
            DataScan response = dataScanServiceClient.updateDataScanAsync(request).get();
          }
        }
      }

      Python

      Python

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Python que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Python de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_update_data_scan():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          data_scan = dataplex_v1.DataScan()
          data_scan.data_quality_spec.rules.dimension = "dimension_value"
          data_scan.data.entity = "entity_value"
      
          request = dataplex_v1.UpdateDataScanRequest(
              data_scan=data_scan,
          )
      
          # Make the request
          operation = client.update_data_scan(request=request)
      
          print("Waiting for operation to complete...")
      
          response = operation.result()
      
          # Handle the response
          print(response)
      
      

      Ruby

      Ruby

      Antes de probar este ejemplo, sigue las instrucciones de configuración para Ruby que se encuentran en la guía de inicio rápido del catálogo universal de Dataplex sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Ruby de Dataplex Universal Catalog.

      Para autenticarte en Dataplex Universal Catalog, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the update_data_scan call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#update_data_scan.
      #
      def update_data_scan
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::UpdateDataScanRequest.new
      
        # Call the update_data_scan method.
        result = client.update_data_scan request
      
        # The returned object is of type Gapic::Operation. You can use it to
        # check the status of an operation, cancel it, or wait for results.
        # Here is how to wait for a response.
        result.wait_until_done! timeout: 60
        if result.response?
          p result.response
        else
          puts "No response received."
        end
      end

      REST

      Para editar un análisis del perfil de datos, usa el método dataScans.patch.

      Borra un análisis de perfil de datos

      Console

      1. En la consola de Google Cloud , en la página Metadata curation de BigQuery, ve a la pestaña Data profiling & quality.

        Ir a Creación de perfiles de datos y calidad

      2. Haz clic en el análisis que quieras borrar.

      3. Haz clic en Borrar y, luego, confirma cuando se te solicite.

      gcloud

      Para borrar un análisis del perfil de datos, usa el comando gcloud dataplex datascans delete:

      gcloud dataplex datascans delete DATASCAN \
      --location=LOCATION --async
      

      Reemplaza las siguientes variables:

      • DATASCAN: Es el nombre del análisis del perfil de datos que se borrará.
      • LOCATION: Es la región de Google Cloud en la que se creó el análisis del perfil de datos.

      REST

      Para borrar un análisis del perfil de datos, usa el método dataScans.delete.

      ¿Qué sigue?