Creare un profilo dei dati

Questo documento spiega come utilizzare le scansioni dei profili dei dati per comprendere meglio i tuoi dati. BigQuery utilizza Dataplex Universal Catalog per analizzare le caratteristiche statistiche dei tuoi dati, come valori medi, valori unici e valori massimi. Dataplex Universal Catalog utilizza queste informazioni anche per consigliare regole per i controlli di qualità dei dati.

Per saperne di più sulla profilazione dei dati, consulta Informazioni sulla profilazione dei dati.

Prima di iniziare

Enable the Dataplex API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per creare e gestire le scansioni di profilazione dei dati, chiedi all'amministratore di concederti i seguenti ruoli IAM sulla risorsa, ad esempio il progetto o la tabella:

  • Per creare, eseguire, aggiornare ed eliminare le scansioni del profilo dati: Ruolo Dataplex DataScan Editor (roles/dataplex.dataScanEditor) nel progetto contenente la scansione dei dati.
  • Per consentire al Catalogo universale Dataplex di eseguire scansioni dei profili dei dati rispetto ai dati BigQuery, concedi i seguenti ruoli all'account di servizio del Catalogo universale Dataplex: Ruolo Utente job BigQuery (roles/bigquery.jobUser) nel progetto che esegue la scansione; ruolo Visualizzatore dati BigQuery (roles/bigquery.dataViewer) nelle tabelle sottoposte a scansione.
  • Per eseguire scansioni dei profili dei dati per le tabelle esterne BigQuery che utilizzano dati Cloud Storage: concedi al service account del Catalogo universale Dataplex i ruoli Visualizzatore oggetti Storage (roles/storage.objectViewer) e Lettore bucket legacy Storage (roles/storage.legacyBucketReader) nel bucket Cloud Storage.
  • Per visualizzare i risultati, i job e la cronologia della scansione del profilo dati: Ruolo Dataplex DataScan Viewer (roles/dataplex.dataScanViewer) nel progetto contenente la scansione dei dati.
  • Per esportare i risultati della scansione di profilazione dei dati in una tabella BigQuery: Ruolo Editor dati BigQuery (roles/bigquery.dataEditor) nella tabella.
  • Per pubblicare i risultati della scansione del profilo dei dati in Dataplex Universal Catalog: Ruolo Editor Dataplex Catalog (roles/dataplex.catalogEditor) nel gruppo di voci @bigquery.
  • Per visualizzare i risultati della scansione del profilo dei dati pubblicati in BigQuery nella scheda Profilo dei dati: Ruolo Visualizzatore dati BigQuery (roles/bigquery.dataViewer) nella tabella.

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Autorizzazioni obbligatorie

Se utilizzi ruoli personalizzati, devi concedere le seguenti autorizzazioni IAM:

  • Per creare, eseguire, aggiornare ed eliminare le scansioni del profilo di dati:
    • dataplex.datascans.create sul progetto: crea un DataScan
    • dataplex.datascans.update nella scansione dei dati: aggiorna la descrizione di un DataScan
    • dataplex.datascans.delete nell'analisi dei dati: elimina un DataScan
    • dataplex.datascans.run sull'analisi dei dati: esegui un DataScan
    • dataplex.datascans.get sulla scansione dei dati: visualizza i dettagli di DataScan esclusi i risultati
    • dataplex.datascans.list sul progetto - Elenco dei DataScan
    • dataplex.dataScanJobs.get sul job di scansione dei dati: leggi le risorse del job DataScan
    • dataplex.dataScanJobs.list on data scan—List DataScan job resources in a project
  • Per consentire al Catalogo universale Dataplex di eseguire scansioni dei profili dati sui dati BigQuery:
    • bigquery.jobs.create sul progetto: esegui job
    • bigquery.tables.get sulla tabella: recupera i metadati della tabella
    • bigquery.tables.getData sulla tabella: recupera i dati della tabella
  • Per eseguire scansioni di profilazione dei dati per le tabelle esterne BigQuery che utilizzano i dati di Cloud Storage:
    • storage.buckets.get sul bucket: leggi i metadati del bucket
    • storage.objects.get sull'oggetto: leggi i dati dell'oggetto
  • Per visualizzare i risultati, i job e la cronologia della scansione del profilo di dati:
    • dataplex.datascans.getData nella scansione dei dati: visualizza i dettagli di DataScan, inclusi i risultati
    • dataplex.datascans.list sul progetto - Elenco dei DataScan
    • dataplex.dataScanJobs.get sul job di scansione dei dati: leggi le risorse del job DataScan
    • dataplex.dataScanJobs.list on data scan—List DataScan job resources in a project
  • Per esportare i risultati della scansione di profilazione dei dati in una tabella BigQuery:
    • bigquery.tables.create sul set di dati: crea tabelle
    • bigquery.tables.updateData sulla tabella: scrivere dati nelle tabelle
  • Per pubblicare i risultati della scansione del profilo dei dati in Dataplex Universal Catalog:
    • dataplex.entryGroups.useDataProfileAspect sul gruppo di voci: consente alle scansioni del profilo dei dati di Dataplex Universal Catalog di salvare i risultati in Dataplex Universal Catalog
    • Inoltre, devi disporre di una delle seguenti autorizzazioni:
      • bigquery.tables.update sulla tabella: aggiorna i metadati della tabella
      • dataplex.entries.update sulla voce: aggiorna le voci
  • Per visualizzare i risultati del profilo dei dati pubblicati per una tabella in BigQuery o Dataplex Universal Catalog:
    • bigquery.tables.get sulla tabella: recupera i metadati della tabella
    • bigquery.tables.getData sulla tabella: recupera i dati della tabella

Se una tabella utilizza la sicurezza a livello di riga di BigQuery, Dataplex Universal Catalog può scansionare solo le righe visibili al account di servizio Dataplex Universal Catalog. Per consentire a Dataplex Universal Catalog di analizzare tutte le righe, aggiungi il relativoaccount di serviziot a un filtro di riga in cui il predicato è TRUE.

Se una tabella utilizza la sicurezza a livello di colonna di BigQuery, Dataplex Universal Catalog richiede l'accesso per eseguire la scansione delle colonne protette. Per concedere l'accesso, assegna al account di servizio Dataplex Universal Catalog il ruolo Lettore granulare di Data Catalog (roles/datacatalog.fineGrainedReader) per tutti i tag di policy utilizzati nella tabella. L'utente che crea o aggiorna una scansione dei dati deve disporre anche delle autorizzazioni per le colonne protette.

Concedi ruoli al account di servizio Dataplex Universal Catalog

Per eseguire le scansioni dei profili dei dati, Dataplex Universal Catalog utilizza un account di servizio che richiede le autorizzazioni per eseguire i job BigQuery e leggere i dati delle tabelle BigQuery. Per concedere i ruoli richiesti, segui questi passaggi:

  1. Ottieni l'indirizzo email del account di servizio Dataplex Universal Catalog. Se non hai creato una scansione del profilo di dati o della qualità dei dati in questo progetto, esegui il seguente comando gcloud per generare l'identità del servizio:

    gcloud beta services identity create --service=dataplex.googleapis.com
    

    Il comando restituisce l'indirizzo email del account di servizio, che ha il seguente formato: service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com.

    Se il account di servizio esiste già, puoi trovare la sua email visualizzando i principal con il nome Dataplex nella pagina IAM della console Google Cloud .

  2. Concedi all'account di servizio il ruolo Utente job BigQuery (roles/bigquery.jobUser) nel tuo progetto. Questo ruolo consente al account di servizio di eseguire job BigQuery per la scansione.

    gcloud projects add-iam-policy-binding PROJECT_ID \
        --member="serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com" \
        --role="roles/bigquery.jobUser"
    

    Sostituisci quanto segue:

    • PROJECT_ID: il tuo ID progetto Google Cloud .
    • service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com: l'indirizzo email del account di servizio Dataplex Universal Catalog.
  3. Concedi all'account di servizio il ruolo Visualizzatore dati BigQuery (roles/bigquery.dataViewer) per ogni tabella di cui vuoi creare il profilo. Questo ruolo concede l'accesso di sola lettura alle tabelle.

    gcloud bigquery tables add-iam-policy-binding DATASET_ID.TABLE_ID \
        --member="serviceAccount:service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com" \
        --role="roles/bigquery.dataViewer"
    

    Sostituisci quanto segue:

    • DATASET_ID: l'ID del set di dati contenente la tabella.
    • TABLE_ID: l'ID della tabella da profilare.
    • service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com: l'indirizzo email del account di servizio Dataplex Universal Catalog.

      Crea una scansione del profilo di dati

      Console

      1. Nella console Google Cloud , nella pagina Organizzazione dei metadati di BigQuery, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic su Crea scansione di profilazione dei dati.

      3. (Facoltativo) Inserisci un Nome visualizzato.

      4. Inserisci un ID. Consulta le convenzioni di denominazione delle risorse.

      5. Facoltativo: inserisci una descrizione.

      6. Nel campo Table (Tabella), fai clic su Sfoglia. Scegli la tabella da analizzare e fai clic su Seleziona.

        Per le tabelle nei set di dati multiregionali, scegli una regione in cui creare la scansione dei dati.

        Per sfogliare le tabelle organizzate all'interno dei lake Dataplex Universal Catalog, fai clic su Sfoglia all'interno dei data lake Dataplex.

      7. Nel campo Ambito, scegli Incrementale o Tutti i dati.

        • Se scegli Dati incrementali, nel campo Colonna timestamp, seleziona una colonna di tipo DATE o TIMESTAMP dalla tabella BigQuery che aumenta man mano che vengono aggiunti nuovi record e che può essere utilizzata per identificare nuovi record. Per le tabelle partizionate in base a una colonna di tipo DATE o TIMESTAMP, consigliamo di utilizzare la colonna di partizionamento come campo timestamp.
      8. (Facoltativo) Per filtrare i dati, esegui una delle seguenti operazioni:

        • Per filtrare per righe, seleziona la casella di controllo Filtra righe. Inserisci un'espressione SQL valida che può essere utilizzata in una clausola WHERE nella sintassi GoogleSQL. Ad esempio: col1 >= 0.

          Il filtro può essere una combinazione di condizioni SQL su più colonne. Ad esempio: col1 >= 0 AND col2 < 10.

        • Per filtrare per colonne, seleziona la casella di controllo Filtra colonne.

          • Per includere colonne nella scansione del profilo, fai clic su Sfoglia nel campo Includi colonne. Seleziona le colonne da includere, quindi fai clic su Seleziona.

          • Per escludere le colonne dalla scansione del profilo, fai clic su Sfoglia nel campo Escludi colonne. Seleziona le colonne da escludere, quindi fai clic su Seleziona.

      9. Per applicare il campionamento alla scansione del profilo dati, seleziona una percentuale di campionamento nell'elenco Dimensione campionamento. Scegli un valore percentuale compreso tra 0,0% e 100,0% con un massimo di 3 cifre decimali.

        • Per set di dati più grandi, scegli una percentuale di campionamento inferiore. Ad esempio, per una tabella da 1 PB, se inserisci un valore compreso tra 0,1% e 1,0%, il profilo dei dati campiona tra 1 e 10 TB di dati.

        • Nei dati campionati devono essere presenti almeno 100 record per restituire un risultato.

        • Per le scansioni incrementali dei dati, la scansione del profilo di dati applica il campionamento all'ultimo incremento.

      10. (Facoltativo) Pubblica i risultati della scansione del profilo dei dati nelle pagine BigQuery e Dataplex Universal Catalog nella consoleGoogle Cloud per la tabella di origine. Seleziona la casella di controllo Pubblica i risultati in BigQuery e Dataplex Catalog.

        Puoi visualizzare i risultati più recenti della scansione nella scheda Profilo dei dati nelle pagine BigQuery e Dataplex Universal Catalog per la tabella di origine. Per consentire agli utenti di accedere ai risultati della scansione pubblicati, consulta la sezione Concedere l'accesso ai risultati della scansione del profilo di dati di questo documento.

        L'opzione di pubblicazione potrebbe non essere disponibile nei seguenti casi:

        • Non disponi delle autorizzazioni necessarie per la tabella.
        • È impostata un'altra scansione della qualità dei dati per pubblicare i risultati.
      11. Nella sezione Pianificazione, scegli una delle seguenti opzioni:

        • Ripeti: esegui la scansione del profilo dei dati in base a una pianificazione: oraria, giornaliera, settimanale, mensile o personalizzata. Specifica la frequenza di esecuzione della scansione e l'ora. Se scegli l'opzione personalizzata, utilizza il formato cron per specificare la pianificazione.

        • On demand: esegui la scansione di profilazione dei dati on demand.

      12. Fai clic su Continua.

      13. (Facoltativo) Esporta i risultati della scansione in una tabella standard BigQuery. Nella sezione Esporta i risultati della scansione in una tabella BigQuery, esegui le seguenti operazioni:

        1. Nel campo Seleziona set di dati BigQuery, fai clic su Sfoglia. Seleziona un set di dati BigQuery per archiviare i risultati della scansione del profilo dati.

        2. Nel campo Tabella BigQuery, specifica la tabella in cui archiviare i risultati della scansione di profilazione dei dati. Se utilizzi una tabella esistente, assicurati che sia compatibile con lo schema della tabella di esportazione. Se la tabella specificata non esiste, Dataplex Universal Catalog la crea per te.

      14. (Facoltativo) Aggiungi etichette. Le etichette sono coppie chiave-valore che consentono di raggruppare oggetti correlati fra loro o con altre risorse Google Cloud .

      15. Per creare la scansione, fai clic su Crea.

        Se imposti la pianificazione su on demand, puoi anche eseguire la scansione ora facendo clic su Esegui scansione.

      gcloud

      Per creare una scansione del profilo di dati, utilizza il comando gcloud dataplex datascans create data-profile.

      Se i dati di origine sono organizzati in un lake Dataplex Universal Catalog, includi il flag --data-source-entity:

      gcloud dataplex datascans create data-profile DATASCAN \
      --location=LOCATION \
      --data-source-entity=DATA_SOURCE_ENTITY
      

      Se i dati di origine non sono organizzati in un lake Dataplex Universal Catalog, includi il flag --data-source-resource:

      gcloud dataplex datascans create data-profile DATASCAN \
      --location=LOCATION \
      --data-source-resource=DATA_SOURCE_RESOURCE
      

      Sostituisci le seguenti variabili:

      • DATASCAN: Il nome della scansione del profilo dei dati.
      • LOCATION: la regione Google Cloud in cui creare la scansione del profilo dei dati.
      • DATA_SOURCE_ENTITY: l'entità Dataplex Universal Catalog che contiene i dati per l'analisi del profilo dati. Ad esempio, projects/test-project/locations/test-location/lakes/test-lake/zones/test-zone/entities/test-entity.
      • DATA_SOURCE_RESOURCE: il nome della risorsa che contiene i dati per la scansione del profilo dei dati. Ad esempio, //bigquery.googleapis.com/projects/test-project/datasets/test-dataset/tables/test-table.

      C#

      C#

      Prima di provare questo esempio, segui le istruzioni di configurazione di C# nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog C#.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      using Google.Api.Gax.ResourceNames;
      using Google.Cloud.Dataplex.V1;
      using Google.LongRunning;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for CreateDataScan</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void CreateDataScanRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              CreateDataScanRequest request = new CreateDataScanRequest
              {
                  ParentAsLocationName = LocationName.FromProjectLocation("[PROJECT]", "[LOCATION]"),
                  DataScan = new DataScan(),
                  DataScanId = "",
                  ValidateOnly = false,
              };
              // Make the request
              Operation<DataScan, OperationMetadata> response = dataScanServiceClient.CreateDataScan(request);
      
              // Poll until the returned long-running operation is complete
              Operation<DataScan, OperationMetadata> completedResponse = response.PollUntilCompleted();
              // Retrieve the operation result
              DataScan result = completedResponse.Result;
      
              // Or get the name of the operation
              string operationName = response.Name;
              // This name can be stored, then the long-running operation retrieved later by name
              Operation<DataScan, OperationMetadata> retrievedResponse = dataScanServiceClient.PollOnceCreateDataScan(operationName);
              // Check if the retrieved long-running operation has completed
              if (retrievedResponse.IsCompleted)
              {
                  // If it has completed, then access the result
                  DataScan retrievedResult = retrievedResponse.Result;
              }
          }
      }

      Vai

      Go

      Prima di provare questo esempio, segui le istruzioni di configurazione di Go nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Go.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.CreateDataScanRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#CreateDataScanRequest.
      	}
      	op, err := c.CreateDataScan(ctx, req)
      	if err != nil {
      		// TODO: Handle error.
      	}
      
      	resp, err := op.Wait(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	// TODO: Use resp.
      	_ = resp
      }
      

      Java

      Java

      Prima di provare questo esempio, segui le istruzioni di configurazione di Java nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Java.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      import com.google.cloud.dataplex.v1.CreateDataScanRequest;
      import com.google.cloud.dataplex.v1.DataScan;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.LocationName;
      
      public class SyncCreateDataScan {
      
        public static void main(String[] args) throws Exception {
          syncCreateDataScan();
        }
      
        public static void syncCreateDataScan() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            CreateDataScanRequest request =
                CreateDataScanRequest.newBuilder()
                    .setParent(LocationName.of("[PROJECT]", "[LOCATION]").toString())
                    .setDataScan(DataScan.newBuilder().build())
                    .setDataScanId("dataScanId1260787906")
                    .setValidateOnly(true)
                    .build();
            DataScan response = dataScanServiceClient.createDataScanAsync(request).get();
          }
        }
      }

      Python

      Python

      Prima di provare questo esempio, segui le istruzioni di configurazione di Python nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Python.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_create_data_scan():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          data_scan = dataplex_v1.DataScan()
          data_scan.data_quality_spec.rules.dimension = "dimension_value"
          data_scan.data.entity = "entity_value"
      
          request = dataplex_v1.CreateDataScanRequest(
              parent="parent_value",
              data_scan=data_scan,
              data_scan_id="data_scan_id_value",
          )
      
          # Make the request
          operation = client.create_data_scan(request=request)
      
          print("Waiting for operation to complete...")
      
          response = operation.result()
      
          # Handle the response
          print(response)
      
      

      Ruby

      Ruby

      Prima di provare questo esempio, segui le istruzioni di configurazione di Ruby nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Ruby.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the create_data_scan call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#create_data_scan.
      #
      def create_data_scan
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::CreateDataScanRequest.new
      
        # Call the create_data_scan method.
        result = client.create_data_scan request
      
        # The returned object is of type Gapic::Operation. You can use it to
        # check the status of an operation, cancel it, or wait for results.
        # Here is how to wait for a response.
        result.wait_until_done! timeout: 60
        if result.response?
          p result.response
        else
          puts "No response received."
        end
      end

      REST

      Per creare una scansione del profilo di dati, utilizza il metodo dataScans.create.

      Crea più scansioni del profilo dati

      Puoi configurare le scansioni di profilazione dei dati per più tabelle in un set di dati BigQuery contemporaneamente utilizzando la console Google Cloud .

      1. Nella console Google Cloud , nella pagina Organizzazione dei metadati di BigQuery, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic su Crea scansione di profilazione dei dati.

      3. Seleziona l'opzione Più scansioni di profilazione dei dati.

      4. Inserisci un prefisso ID. Il catalogo universale Dataplex genera automaticamente gli ID scansione utilizzando il prefisso fornito e i suffissi univoci.

      5. Inserisci una Descrizione per tutte le scansioni del profilo di dati.

      6. Nel campo Set di dati, fai clic su Sfoglia. Seleziona un set di dati da cui scegliere le tabelle. Fai clic su Seleziona.

      7. Se il set di dati è multiregionale, seleziona una regione in cui creare le scansioni del profilo dati.

      8. Configura le impostazioni comuni per le scansioni:

        1. Nel campo Ambito, scegli Incrementale o Tutti i dati.

        2. Per applicare il campionamento alle scansioni del profilo dati, seleziona una percentuale di campionamento nell'elenco Dimensione campionamento.

          Scegli un valore percentuale compreso tra 0,0% e 100,0% con un massimo di tre cifre decimali.

        3. (Facoltativo) Pubblica i risultati della scansione del profilo dei dati nelle pagine BigQuery e Dataplex Universal Catalog nella consoleGoogle Cloud per la tabella di origine. Seleziona la casella di controllo Pubblica i risultati in BigQuery e Dataplex Catalog.

          Puoi visualizzare i risultati più recenti della scansione nella scheda Profilo dei dati nelle pagine BigQuery e Dataplex Universal Catalog per la tabella di origine. Per consentire agli utenti di accedere ai risultati della scansione pubblicati, consulta la sezione Concedere l'accesso ai risultati della scansione del profilo di dati di questo documento.

        4. Nella sezione Pianificazione, scegli una delle seguenti opzioni:

          • Ripeti: esegui le scansioni del profilo dei dati in base a una pianificazione: oraria, giornaliera, settimanale, mensile o personalizzata. Specifica la frequenza di esecuzione delle scansioni e l'ora. Se scegli l'opzione personalizzata, utilizza il formato cron per specificare la pianificazione.

          • On demand: esegui le scansioni di profilazione dei dati on demand.

      9. Fai clic su Continua.

      10. Nel campo Scegli tabelle, fai clic su Sfoglia. Scegli una o più tabelle da scansionare, quindi fai clic su Seleziona.

      11. Fai clic su Continua.

      12. (Facoltativo) Esporta i risultati della scansione in una tabella standard BigQuery. Nella sezione Esporta i risultati della scansione in una tabella BigQuery, esegui le seguenti operazioni:

        1. Nel campo Seleziona set di dati BigQuery, fai clic su Sfoglia. Seleziona un set di dati BigQuery per archiviare i risultati della scansione del profilo dati.

        2. Nel campo Tabella BigQuery, specifica la tabella in cui archiviare i risultati della scansione di profilazione dei dati. Se utilizzi una tabella esistente, assicurati che sia compatibile con lo schema della tabella di esportazione. Se la tabella specificata non esiste, Dataplex Universal Catalog la crea per te.

          Dataplex Universal Catalog utilizza la stessa tabella dei risultati per tutte le scansioni dei profili dei dati.

      13. (Facoltativo) Aggiungi etichette. Le etichette sono coppie chiave-valore che consentono di raggruppare oggetti correlati fra loro o con altre risorse Google Cloud .

      14. Per creare le scansioni, fai clic su Crea.

        Se imposti la pianificazione su on demand, puoi anche eseguire le scansioni ora facendo clic su Esegui scansione.

      Esegui una scansione del profilo di dati

      Console

      1. Nella console Google Cloud , nella pagina Organizzazione dei metadati di BigQuery, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic sulla scansione del profilo dati da eseguire.
      3. Fai clic su Esegui ora.

      gcloud

      Per eseguire una scansione del profilo di dati, utilizza il comando gcloud dataplex datascans run:

      gcloud dataplex datascans run DATASCAN \
      --location=LOCATION
      

      Sostituisci le seguenti variabili:

      • DATASCAN: Il nome della scansione del profilo dei dati.
      • LOCATION: la regione Google Cloud in cui è stata creata la scansione del profilo di dati.

      C#

      C#

      Prima di provare questo esempio, segui le istruzioni di configurazione di C# nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog C#.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      using Google.Cloud.Dataplex.V1;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for RunDataScan</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void RunDataScanRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              RunDataScanRequest request = new RunDataScanRequest
              {
                  DataScanName = DataScanName.FromProjectLocationDataScan("[PROJECT]", "[LOCATION]", "[DATASCAN]"),
              };
              // Make the request
              RunDataScanResponse response = dataScanServiceClient.RunDataScan(request);
          }
      }

      Vai

      Go

      Prima di provare questo esempio, segui le istruzioni di configurazione di Go nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Go.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.RunDataScanRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#RunDataScanRequest.
      	}
      	resp, err := c.RunDataScan(ctx, req)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	// TODO: Use resp.
      	_ = resp
      }
      

      Java

      Java

      Prima di provare questo esempio, segui le istruzioni di configurazione di Java nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Java.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      import com.google.cloud.dataplex.v1.DataScanName;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.RunDataScanRequest;
      import com.google.cloud.dataplex.v1.RunDataScanResponse;
      
      public class SyncRunDataScan {
      
        public static void main(String[] args) throws Exception {
          syncRunDataScan();
        }
      
        public static void syncRunDataScan() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            RunDataScanRequest request =
                RunDataScanRequest.newBuilder()
                    .setName(DataScanName.of("[PROJECT]", "[LOCATION]", "[DATASCAN]").toString())
                    .build();
            RunDataScanResponse response = dataScanServiceClient.runDataScan(request);
          }
        }
      }

      Python

      Python

      Prima di provare questo esempio, segui le istruzioni di configurazione di Python nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Python.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_run_data_scan():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          request = dataplex_v1.RunDataScanRequest(
              name="name_value",
          )
      
          # Make the request
          response = client.run_data_scan(request=request)
      
          # Handle the response
          print(response)
      
      

      Ruby

      Ruby

      Prima di provare questo esempio, segui le istruzioni di configurazione di Ruby nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Ruby.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the run_data_scan call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#run_data_scan.
      #
      def run_data_scan
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::RunDataScanRequest.new
      
        # Call the run_data_scan method.
        result = client.run_data_scan request
      
        # The returned object is of type Google::Cloud::Dataplex::V1::RunDataScanResponse.
        p result
      end

      REST

      Per eseguire una scansione del profilo di dati, utilizza il metodo dataScans.run.

      Visualizzare i risultati della scansione del profilo di dati

      Console

      1. Nella console Google Cloud , nella pagina Organizzazione dei metadati di BigQuery, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic sul nome di una scansione di profilazione dei dati.

        • La sezione Panoramica mostra informazioni sui job più recenti, tra cui la data di esecuzione della scansione, il numero di record della tabella scansionati e lo stato del job.

        • La sezione Configurazione della scansione del profilo di dati mostra i dettagli della scansione.

      3. Per visualizzare informazioni dettagliate su un job, ad esempio le colonne della tabella scansionata, le statistiche sulle colonne trovate nella scansione e i log dei job, fai clic sulla scheda Cronologia job. Quindi, fai clic su un ID job.

      gcloud

      Per visualizzare i risultati di un job di scansione del profilo di dati, utilizza il comando gcloud dataplex datascans jobs describe:

      gcloud dataplex datascans jobs describe JOB \
      --location=LOCATION \
      --datascan=DATASCAN \
      --view=FULL
      

      Sostituisci le seguenti variabili:

      • JOB: l'ID job del job di scansione del profilo dei dati.
      • LOCATION: la regione Google Cloud in cui è stata creata la scansione del profilo di dati.
      • DATASCAN: il nome della scansione del profilo dei dati a cui appartiene il job.
      • --view=FULL: per visualizzare il risultato del job di scansione, specifica FULL.

      C#

      C#

      Prima di provare questo esempio, segui le istruzioni di configurazione di C# nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog C#.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      using Google.Cloud.Dataplex.V1;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for GetDataScan</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void GetDataScanRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              GetDataScanRequest request = new GetDataScanRequest
              {
                  DataScanName = DataScanName.FromProjectLocationDataScan("[PROJECT]", "[LOCATION]", "[DATASCAN]"),
                  View = GetDataScanRequest.Types.DataScanView.Unspecified,
              };
              // Make the request
              DataScan response = dataScanServiceClient.GetDataScan(request);
          }
      }

      Vai

      Go

      Prima di provare questo esempio, segui le istruzioni di configurazione di Go nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Go.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.GetDataScanRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#GetDataScanRequest.
      	}
      	resp, err := c.GetDataScan(ctx, req)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	// TODO: Use resp.
      	_ = resp
      }
      

      Java

      Java

      Prima di provare questo esempio, segui le istruzioni di configurazione di Java nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Java.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      import com.google.cloud.dataplex.v1.DataScan;
      import com.google.cloud.dataplex.v1.DataScanName;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.GetDataScanRequest;
      
      public class SyncGetDataScan {
      
        public static void main(String[] args) throws Exception {
          syncGetDataScan();
        }
      
        public static void syncGetDataScan() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            GetDataScanRequest request =
                GetDataScanRequest.newBuilder()
                    .setName(DataScanName.of("[PROJECT]", "[LOCATION]", "[DATASCAN]").toString())
                    .build();
            DataScan response = dataScanServiceClient.getDataScan(request);
          }
        }
      }

      Python

      Python

      Prima di provare questo esempio, segui le istruzioni di configurazione di Python nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Python.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_get_data_scan():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          request = dataplex_v1.GetDataScanRequest(
              name="name_value",
          )
      
          # Make the request
          response = client.get_data_scan(request=request)
      
          # Handle the response
          print(response)
      
      

      Ruby

      Ruby

      Prima di provare questo esempio, segui le istruzioni di configurazione di Ruby nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Ruby.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the get_data_scan call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#get_data_scan.
      #
      def get_data_scan
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::GetDataScanRequest.new
      
        # Call the get_data_scan method.
        result = client.get_data_scan request
      
        # The returned object is of type Google::Cloud::Dataplex::V1::DataScan.
        p result
      end

      REST

      Per visualizzare i risultati di una scansione del profilo dati, utilizza il metodo dataScans.get.

      Visualizzare i risultati pubblicati

      Se i risultati della scansione del profilo di dati vengono pubblicati nelle pagine BigQuery e Dataplex Universal Catalog nella console Google Cloud , puoi visualizzare i risultati più recenti della scansione nella scheda Profilo di dati della tabella di origine.

      1. Nella console Google Cloud , vai alla pagina BigQuery.

        Vai a BigQuery

      2. Nel riquadro a sinistra, fai clic su Explorer:

        Pulsante evidenziato per il riquadro Spazio di esplorazione.

        Se non vedi il riquadro a sinistra, fai clic su Espandi riquadro a sinistra per aprirlo.

      3. Nel riquadro Explorer, fai clic su Set di dati e poi sul tuo set di dati.

      4. Fai clic su Panoramica > Tabelle, quindi seleziona la tabella di cui vuoi visualizzare i risultati della scansione del profilo dei dati.

      5. Fai clic sulla scheda Profilo dei dati.

        Vengono visualizzati gli ultimi risultati pubblicati.

      Visualizza il job di scansione del profilo di dati più recente

      Console

      1. Nella console Google Cloud , nella pagina BigQuery Cura dei metadati, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic sul nome di una scansione di profilazione dei dati.

      3. Fai clic sulla scheda Risultati del job più recente.

        La scheda Risultati del job più recente, quando è presente almeno un'esecuzione completata correttamente, fornisce informazioni sul job più recente. Elenca le colonne e le statistiche della tabella scansionata relative alle colonne trovate nella scansione.

      gcloud

      Per visualizzare l'ultima scansione riuscita del profilo dei dati, utilizza il comando gcloud dataplex datascans describe:

      gcloud dataplex datascans describe DATASCAN \
      --location=LOCATION \
      --view=FULL
      

      Sostituisci le seguenti variabili:

      • DATASCAN: il nome della scansione del profilo dei dati per visualizzare il job più recente.
      • LOCATION: la Google Cloud regione in cui è stata creata la scansione di profilazione dei dati.
      • --view=FULL: per visualizzare il risultato del job di scansione, specifica FULL.

      REST

      Per visualizzare il job di scansione più recente, utilizza il metodo dataScans.get.

      Visualizzare i risultati storici delle scansioni

      Dataplex Universal Catalog salva la cronologia delle scansioni del profilo dati degli ultimi 300 job o dell'ultimo anno, a seconda di quale si verifica per primo.

      Console

      1. Nella console Google Cloud , nella pagina BigQuery Cura dei metadati, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic sul nome di una scansione di profilazione dei dati.

      3. Fai clic sulla scheda Cronologia dei job.

        La scheda Cronologia job fornisce informazioni sui job precedenti, ad esempio il numero di record scansionati in ogni job, lo stato del job e l'ora in cui è stato eseguito il job.

      4. Per visualizzare informazioni dettagliate su un job, fai clic su uno qualsiasi dei job nella colonna ID job.

      gcloud

      Per visualizzare i job di scansione del profilo di dati storici, utilizza il comando gcloud dataplex datascans jobs list:

      gcloud dataplex datascans jobs list \
      --location=LOCATION \
      --datascan=DATASCAN
      

      Sostituisci le seguenti variabili:

      • LOCATION: la Google Cloud regione in cui è stata creata la scansione di profilazione dei dati.
      • DATASCAN: il nome della scansione del profilo dei dati per visualizzare i job.

      C#

      C#

      Prima di provare questo esempio, segui le istruzioni di configurazione di C# nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog C#.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      using Google.Api.Gax;
      using Google.Cloud.Dataplex.V1;
      using System;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for ListDataScanJobs</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void ListDataScanJobsRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              ListDataScanJobsRequest request = new ListDataScanJobsRequest
              {
                  ParentAsDataScanName = DataScanName.FromProjectLocationDataScan("[PROJECT]", "[LOCATION]", "[DATASCAN]"),
                  Filter = "",
              };
              // Make the request
              PagedEnumerable<ListDataScanJobsResponse, DataScanJob> response = dataScanServiceClient.ListDataScanJobs(request);
      
              // Iterate over all response items, lazily performing RPCs as required
              foreach (DataScanJob item in response)
              {
                  // Do something with each item
                  Console.WriteLine(item);
              }
      
              // Or iterate over pages (of server-defined size), performing one RPC per page
              foreach (ListDataScanJobsResponse page in response.AsRawResponses())
              {
                  // Do something with each page of items
                  Console.WriteLine("A page of results:");
                  foreach (DataScanJob item in page)
                  {
                      // Do something with each item
                      Console.WriteLine(item);
                  }
              }
      
              // Or retrieve a single page of known size (unless it's the final page), performing as many RPCs as required
              int pageSize = 10;
              Page<DataScanJob> singlePage = response.ReadPage(pageSize);
              // Do something with the page of items
              Console.WriteLine($"A page of {pageSize} results (unless it's the final page):");
              foreach (DataScanJob item in singlePage)
              {
                  // Do something with each item
                  Console.WriteLine(item);
              }
              // Store the pageToken, for when the next page is required.
              string nextPageToken = singlePage.NextPageToken;
          }
      }

      Vai

      Go

      Prima di provare questo esempio, segui le istruzioni di configurazione di Go nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Go.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      	"google.golang.org/api/iterator"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.ListDataScanJobsRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#ListDataScanJobsRequest.
      	}
      	it := c.ListDataScanJobs(ctx, req)
      	for {
      		resp, err := it.Next()
      		if err == iterator.Done {
      			break
      		}
      		if err != nil {
      			// TODO: Handle error.
      		}
      		// TODO: Use resp.
      		_ = resp
      
      		// If you need to access the underlying RPC response,
      		// you can do so by casting the `Response` as below.
      		// Otherwise, remove this line. Only populated after
      		// first call to Next(). Not safe for concurrent access.
      		_ = it.Response.(*dataplexpb.ListDataScanJobsResponse)
      	}
      }
      

      Java

      Java

      Prima di provare questo esempio, segui le istruzioni di configurazione di Java nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Java.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      import com.google.cloud.dataplex.v1.DataScanJob;
      import com.google.cloud.dataplex.v1.DataScanName;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.ListDataScanJobsRequest;
      
      public class SyncListDataScanJobs {
      
        public static void main(String[] args) throws Exception {
          syncListDataScanJobs();
        }
      
        public static void syncListDataScanJobs() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            ListDataScanJobsRequest request =
                ListDataScanJobsRequest.newBuilder()
                    .setParent(DataScanName.of("[PROJECT]", "[LOCATION]", "[DATASCAN]").toString())
                    .setPageSize(883849137)
                    .setPageToken("pageToken873572522")
                    .setFilter("filter-1274492040")
                    .build();
            for (DataScanJob element : dataScanServiceClient.listDataScanJobs(request).iterateAll()) {
              // doThingsWith(element);
            }
          }
        }
      }

      Python

      Python

      Prima di provare questo esempio, segui le istruzioni di configurazione di Python nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Python.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_list_data_scan_jobs():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          request = dataplex_v1.ListDataScanJobsRequest(
              parent="parent_value",
          )
      
          # Make the request
          page_result = client.list_data_scan_jobs(request=request)
      
          # Handle the response
          for response in page_result:
              print(response)
      
      

      Ruby

      Ruby

      Prima di provare questo esempio, segui le istruzioni di configurazione di Ruby nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Ruby.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the list_data_scan_jobs call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#list_data_scan_jobs.
      #
      def list_data_scan_jobs
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::ListDataScanJobsRequest.new
      
        # Call the list_data_scan_jobs method.
        result = client.list_data_scan_jobs request
      
        # The returned object is of type Gapic::PagedEnumerable. You can iterate
        # over elements, and API calls will be issued to fetch pages as needed.
        result.each do |item|
          # Each element is of type ::Google::Cloud::Dataplex::V1::DataScanJob.
          p item
        end
      end

      REST

      Per visualizzare i job di scansione del profilo di dati storici, utilizza il metodo dataScans.jobs.list.

      Visualizzare le scansioni del profilo di dati per una tabella

      Per visualizzare le scansioni del profilo dei dati che si applicano a una tabella specifica:

      1. Nella console Google Cloud , nella pagina Organizzazione dei metadati di BigQuery, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Filtra l'elenco in base al nome della tabella e al tipo di scansione.

      Concedere l'accesso ai risultati della scansione del profilo dati

      Per consentire agli utenti della tua organizzazione di visualizzare i risultati della scansione:

      1. Nella console Google Cloud , nella pagina Organizzazione dei metadati di BigQuery, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic sulla scansione della qualità dei dati di cui vuoi condividere i risultati.

      3. Fai clic sulla scheda Autorizzazioni.

      4. Segui questi passaggi:

        • Per concedere l'accesso a un'entità, fai clic su Concedi l'accesso. Concedi il ruolo Dataplex DataScan DataViewer all'entità associata.
        • Per rimuovere l'accesso da un'entità, seleziona l'entità da cui vuoi rimuovere il ruolo Dataplex DataScan DataViewer. Fai clic su Rimuovi accesso e poi conferma quando richiesto.

      Gestire le scansioni del profilo di dati per una tabella specifica

      I passaggi descritti in questo documento mostrano come gestire le scansioni dei profili dei dati nel tuo progetto utilizzando la pagina Cura dei metadati> Profilazione e qualità dei dati di BigQuery nella consoleGoogle Cloud .

      Puoi anche creare e gestire le scansioni dei profili dei dati quando lavori con una tabella specifica. Nella console Google Cloud , nella pagina BigQuery della tabella, utilizza la scheda Profilo dati. Segui questi passaggi:

      1. Nella console Google Cloud , vai alla pagina BigQuery.

        Vai a BigQuery

        Nel riquadro Explorer (nel riquadro a sinistra), fai clic su Set di dati e poi sul tuo set di dati. Ora fai clic su Panoramica > Tabelle e seleziona la tabella di cui vuoi visualizzare i risultati dell'analisi del profilo dei dati.

      2. Fai clic sulla scheda Profilo dei dati.

      3. A seconda che la tabella abbia una scansione del profilo di dati i cui risultati sono pubblicati, puoi lavorare con le scansioni del profilo di dati della tabella nei seguenti modi:

        • I risultati della scansione del profilo di dati sono pubblicati: nella pagina vengono visualizzati i risultati dell'ultima scansione pubblicata.

          Per gestire le scansioni del profilo di dati per questa tabella, fai clic su Scansione del profilo dati e poi seleziona una delle seguenti opzioni:

          • Crea nuova scansione: crea una nuova scansione del profilo di dati. Per saperne di più, consulta la sezione Crea una scansione di profilazione dei dati di questo documento. Quando crei una scansione dalla pagina dei dettagli di una tabella, la tabella è preselezionata.

          • Esegui ora: esegui la scansione.

          • Modifica configurazione di scansione: modifica le impostazioni, tra cui il nome visualizzato, i filtri, le dimensioni del campionamento e la pianificazione.

          • Gestisci autorizzazioni della scansione: controlla chi può accedere ai risultati della scansione. Per saperne di più, consulta la sezione Concedere l'accesso ai risultati della scansione del profilo di dati di questo documento.

          • Visualizza risultati cronologici: visualizza informazioni dettagliate sui job di scansione di profilazione dei dati precedenti. Per saperne di più, consulta le sezioni Visualizzare i risultati della scansione del profilo di dati e Visualizzare i risultati delle scansioni storiche di questo documento.

          • Visualizza tutte le scansioni: visualizza un elenco delle scansioni del profilo di dati che si applicano a questa tabella.

        • I risultati della scansione del profilo di dati non vengono pubblicati: fai clic sul menu accanto a Profilo dati rapido e seleziona una delle seguenti opzioni:

          • Personalizza la profilazione dei dati: crea una nuova scansione di profilazione dei dati. Per saperne di più, consulta la sezione Creare una scansione di profilazione dei dati di questo documento. Quando crei una scansione dalla pagina dei dettagli di una tabella, la tabella è preselezionata.

          • Visualizza profili precedenti: visualizza un elenco delle scansioni dei profili di dati che si applicano a questa tabella.

      Aggiorna una scansione del profilo di dati

      Console

      1. Nella console Google Cloud , nella pagina Organizzazione dei metadati di BigQuery, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic sul nome di una scansione di profilazione dei dati.

      3. Fai clic su Modifica e poi modifica i valori.

      4. Fai clic su Salva.

      gcloud

      Per aggiornare una scansione del profilo dei dati, utilizza il comando gcloud dataplex datascans update data-profile:

      gcloud dataplex datascans update data-profile DATASCAN \
      --location=LOCATION \
      --description=DESCRIPTION
      

      Sostituisci le seguenti variabili:

      • DATASCAN: il nome della scansione del profilo dei dati da aggiornare.
      • LOCATION: la Google Cloud regione in cui è stata creata la scansione di profilazione dei dati.
      • DESCRIPTION: La nuova descrizione della scansione del profilo dei dati.

      C#

      C#

      Prima di provare questo esempio, segui le istruzioni di configurazione di C# nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog C#.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      using Google.Cloud.Dataplex.V1;
      using Google.LongRunning;
      using Google.Protobuf.WellKnownTypes;
      
      public sealed partial class GeneratedDataScanServiceClientSnippets
      {
          /// <summary>Snippet for UpdateDataScan</summary>
          /// <remarks>
          /// This snippet has been automatically generated and should be regarded as a code template only.
          /// It will require modifications to work:
          /// - It may require correct/in-range values for request initialization.
          /// - It may require specifying regional endpoints when creating the service client as shown in
          ///   https://cloud.google.com/dotnet/docs/reference/help/client-configuration#endpoint.
          /// </remarks>
          public void UpdateDataScanRequestObject()
          {
              // Create client
              DataScanServiceClient dataScanServiceClient = DataScanServiceClient.Create();
              // Initialize request argument(s)
              UpdateDataScanRequest request = new UpdateDataScanRequest
              {
                  DataScan = new DataScan(),
                  UpdateMask = new FieldMask(),
                  ValidateOnly = false,
              };
              // Make the request
              Operation<DataScan, OperationMetadata> response = dataScanServiceClient.UpdateDataScan(request);
      
              // Poll until the returned long-running operation is complete
              Operation<DataScan, OperationMetadata> completedResponse = response.PollUntilCompleted();
              // Retrieve the operation result
              DataScan result = completedResponse.Result;
      
              // Or get the name of the operation
              string operationName = response.Name;
              // This name can be stored, then the long-running operation retrieved later by name
              Operation<DataScan, OperationMetadata> retrievedResponse = dataScanServiceClient.PollOnceUpdateDataScan(operationName);
              // Check if the retrieved long-running operation has completed
              if (retrievedResponse.IsCompleted)
              {
                  // If it has completed, then access the result
                  DataScan retrievedResult = retrievedResponse.Result;
              }
          }
      }

      Vai

      Go

      Prima di provare questo esempio, segui le istruzioni di configurazione di Go nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Go.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      
      package main
      
      import (
      	"context"
      
      	dataplex "cloud.google.com/go/dataplex/apiv1"
      	dataplexpb "cloud.google.com/go/dataplex/apiv1/dataplexpb"
      )
      
      func main() {
      	ctx := context.Background()
      	// This snippet has been automatically generated and should be regarded as a code template only.
      	// It will require modifications to work:
      	// - It may require correct/in-range values for request initialization.
      	// - It may require specifying regional endpoints when creating the service client as shown in:
      	//   https://pkg.go.dev/cloud.google.com/go#hdr-Client_Options
      	c, err := dataplex.NewDataScanClient(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	defer c.Close()
      
      	req := &dataplexpb.UpdateDataScanRequest{
      		// TODO: Fill request struct fields.
      		// See https://pkg.go.dev/cloud.google.com/go/dataplex/apiv1/dataplexpb#UpdateDataScanRequest.
      	}
      	op, err := c.UpdateDataScan(ctx, req)
      	if err != nil {
      		// TODO: Handle error.
      	}
      
      	resp, err := op.Wait(ctx)
      	if err != nil {
      		// TODO: Handle error.
      	}
      	// TODO: Use resp.
      	_ = resp
      }
      

      Java

      Java

      Prima di provare questo esempio, segui le istruzioni di configurazione di Java nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Java.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      import com.google.cloud.dataplex.v1.DataScan;
      import com.google.cloud.dataplex.v1.DataScanServiceClient;
      import com.google.cloud.dataplex.v1.UpdateDataScanRequest;
      import com.google.protobuf.FieldMask;
      
      public class SyncUpdateDataScan {
      
        public static void main(String[] args) throws Exception {
          syncUpdateDataScan();
        }
      
        public static void syncUpdateDataScan() throws Exception {
          // This snippet has been automatically generated and should be regarded as a code template only.
          // It will require modifications to work:
          // - It may require correct/in-range values for request initialization.
          // - It may require specifying regional endpoints when creating the service client as shown in
          // https://cloud.google.com/java/docs/setup#configure_endpoints_for_the_client_library
          try (DataScanServiceClient dataScanServiceClient = DataScanServiceClient.create()) {
            UpdateDataScanRequest request =
                UpdateDataScanRequest.newBuilder()
                    .setDataScan(DataScan.newBuilder().build())
                    .setUpdateMask(FieldMask.newBuilder().build())
                    .setValidateOnly(true)
                    .build();
            DataScan response = dataScanServiceClient.updateDataScanAsync(request).get();
          }
        }
      }

      Python

      Python

      Prima di provare questo esempio, segui le istruzioni di configurazione di Python nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Python.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      # This snippet has been automatically generated and should be regarded as a
      # code template only.
      # It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      #   client as shown in:
      #   https://googleapis.dev/python/google-api-core/latest/client_options.html
      from google.cloud import dataplex_v1
      
      
      def sample_update_data_scan():
          # Create a client
          client = dataplex_v1.DataScanServiceClient()
      
          # Initialize request argument(s)
          data_scan = dataplex_v1.DataScan()
          data_scan.data_quality_spec.rules.dimension = "dimension_value"
          data_scan.data.entity = "entity_value"
      
          request = dataplex_v1.UpdateDataScanRequest(
              data_scan=data_scan,
          )
      
          # Make the request
          operation = client.update_data_scan(request=request)
      
          print("Waiting for operation to complete...")
      
          response = operation.result()
      
          # Handle the response
          print(response)
      
      

      Ruby

      Ruby

      Prima di provare questo esempio, segui le istruzioni di configurazione di Ruby nella guida rapida di Dataplex Universal Catalog per l'utilizzo delle librerie client. Per saperne di più, consulta la documentazione di riferimento dell'API Dataplex Universal Catalog Ruby.

      Per eseguire l'autenticazione in Dataplex Universal Catalog, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, consulta Configura l'autenticazione per un ambiente di sviluppo locale.

      require "google/cloud/dataplex/v1"
      
      ##
      # Snippet for the update_data_scan call in the DataScanService service
      #
      # This snippet has been automatically generated and should be regarded as a code
      # template only. It will require modifications to work:
      # - It may require correct/in-range values for request initialization.
      # - It may require specifying regional endpoints when creating the service
      # client as shown in https://cloud.google.com/ruby/docs/reference.
      #
      # This is an auto-generated example demonstrating basic usage of
      # Google::Cloud::Dataplex::V1::DataScanService::Client#update_data_scan.
      #
      def update_data_scan
        # Create a client object. The client can be reused for multiple calls.
        client = Google::Cloud::Dataplex::V1::DataScanService::Client.new
      
        # Create a request. To set request fields, pass in keyword arguments.
        request = Google::Cloud::Dataplex::V1::UpdateDataScanRequest.new
      
        # Call the update_data_scan method.
        result = client.update_data_scan request
      
        # The returned object is of type Gapic::Operation. You can use it to
        # check the status of an operation, cancel it, or wait for results.
        # Here is how to wait for a response.
        result.wait_until_done! timeout: 60
        if result.response?
          p result.response
        else
          puts "No response received."
        end
      end

      REST

      Per modificare una scansione del profilo di dati, utilizza il metodo dataScans.patch.

      Eliminare una scansione del profilo di dati

      Console

      1. Nella console Google Cloud , nella pagina Organizzazione dei metadati di BigQuery, vai alla scheda Profilazione e qualità dei dati.

        Vai a Profilazione e qualità dei dati

      2. Fai clic sulla scansione che vuoi eliminare.

      3. Fai clic su Elimina e poi conferma quando richiesto.

      gcloud

      Per eliminare una scansione del profilo dati, utilizza il comando gcloud dataplex datascans delete:

      gcloud dataplex datascans delete DATASCAN \
      --location=LOCATION --async
      

      Sostituisci le seguenti variabili:

      • DATASCAN: il nome della scansione del profilo dei dati da eliminare.
      • LOCATION: la Google Cloud regione in cui è stata creata la scansione di profilazione dei dati.

      REST

      Per eliminare una scansione del profilo dati, utilizza il metodo dataScans.delete.

      Passaggi successivi