Utilizzare la modalità di emulazione rigorosa

La modalità di emulazione rigorosa attiva un controllo di sicurezza aggiuntivo per le seguenti azioni utente in Dataform:

  • Creazione o aggiornamento di un repository.
  • Creazione o aggiornamento di una configurazione del workflow.
  • Creazione di una chiamata del workflow.
  • Aggiornamento di una configurazione di release.

Questo controllo di sicurezza aggiuntivo richiede che l'utente che esegue queste azioni disponga dell'autorizzazione iam.serviceAccounts.actAs per l'account di servizio effettivo, ovvero l'account di servizio le cui credenziali vengono utilizzate per eseguire i workflow. Per saperne di più, consulta Collegare service account alle risorse.

Per attivare la modalità Agisci come, segui questi passaggi:

  • Quando crei un repository.
  • Quando aggiorni un repository esistente con il flag strict_act_as_checks del repository.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per completare le attività descritte in questo documento, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Verificare le autorizzazioni act-as per il service account effettivo

Per garantire che i flussi di lavoro Dataform vengano eseguiti in modo sicuro e senza interruzioni, è importante verificare le autorizzazioni di rappresentazione sugli account di servizio che utilizzano. Questa sezione spiega come identificare l'account di servizio effettivo per le tue risorse, utilizzare Cloud Logging per verificare la presenza di problemi di autorizzazione e quindi risolvere eventuali problemi riscontrati.

Determinare il service account effettivo

Puoi determinare il service account effettivo che esegue i flussi di lavoro in base al tipo di risorsa e alle seguenti condizioni:

Tipo di risorsa Service account effettivo
Repository

Per i nuovi repository, viene utilizzato il service account personalizzato selezionato quando crei un repository. Questo service account è elencato nel campo Repository.ServiceAccount.

Per i repository esistenti, può trattarsi di un service account personalizzato (consigliato) o dell'agente di servizio Dataform.

Configurazione del workflow

Per le nuove configurazioni del flusso di lavoro, viene utilizzato il service account personalizzato selezionato quando crei una configurazione del flusso di lavoro. Se non è selezionato alcun service account, viene utilizzato il service account del repository.

Per le configurazioni del flusso di lavoro esistenti, può trattarsi di un service account personalizzato (consigliato) o dell'agente di servizio Dataform del repository.

Chiamata workflow

Se il risultato della compilazione è una risorsa WORKFLOW_CONFIG, viene utilizzato il service account effettivo della configurazione del flusso di lavoro.

Se crei una chiamata del flusso di lavoro da un risultato di compilazione, viene utilizzato l'account di servizio elencato nel campo WorkflowInvocation.InvocationConfig, se impostato.

In caso contrario, il valore predefinito è il service account configurato a livello di repository.

Controllare i problemi di autorizzazione in Cloud Logging

Per migliorare la sicurezza, Dataform controlla se l'autorizzazione iam.serviceAccounts.actAs non è presente nei service account utilizzati dalle risorse Dataform.

I risultati di questi controlli, inclusi eventuali problemi di autorizzazione, vengono registrati in Cloud Logging. Devi esaminare regolarmente questi log per identificare e concedere le autorizzazioni iam.serviceAccounts.actAs mancanti. Il controllo di questi log garantisce che i flussi di lavoro e le configurazioni di Dataform continuino a funzionare senza interruzioni.

Visualizza i log in Cloud Logging

  1. Nella console Google Cloud , vai alla pagina Esplora log.

    Vai a Esplora log

  2. Seleziona il progetto Google Cloud in cui vuoi controllare i log.

  3. Utilizza l'editor di query per filtrare i log di Dataform actAs con le seguenti opzioni:

    • Per elencare solo i controlli actAs non riusciti che richiedono un'azione, utilizza la seguente query:

      logName: "projects/PROJECT_ID/logs/dataform.googleapis.com%2Factas_dry_run_result"
      jsonPayload.dryRunResult = false
      
    • Per elencare tutti i controlli actAs, utilizza la seguente query:

      logName: "projects/PROJECT_ID/logs/dataform.googleapis.com%2Factas_dry_run_result"
      

    Sostituisci PROJECT_ID con l'ID progettoGoogle Cloud .

  4. Fai clic su Esegui query.

Interpretare le voci di log

Espandi una voce di log nei risultati della query per visualizzare i seguenti campi jsonPayload:

Campo Tipo Descrizione
dryRunResult Booleano true: il controllo delle autorizzazioni è stato superato.

false: il controllo non è riuscito. L'entità chiamante non dispone dell'autorizzazione iam.serviceAccounts.actAs per il service account.
caller Stringa L'indirizzo email dell'entità (utente o service account) che ha avviato la chiamata API.
serviceAccount Stringa Il service account che l'entità chiamante ha tentato di utilizzare. Questo campo è in genere presente quando il campo dryRunResult è false.
apiMethod Stringa Il metodo dell'API Dataform che ha attivato il controllo, ad esempio CreateWorkflowInvocation o UpdateRepository.
*_context Oggetto Un oggetto contenente i nomi delle risorse pertinenti al metodo API chiamato. Per saperne di più, consulta Oggetti di contesto.
Oggetti di contesto

La voce di log include un oggetto di contesto all'interno dei campi jsonPayload. I campi di questo oggetto contengono i nomi completi delle risorse Google Cloud delle entità Dataform coinvolte. Questi nomi seguono le strutture standard mostrate nell'elenco seguente, consentendoti di identificare con precisione le risorse.

  • create_workflow_invocation_context: presente quando il metodo API è CreateWorkflowInvocation.

    • workflowInvocation: il nome della risorsa dell'invocazione del flusso di lavoro.
      • Il formato del nome della risorsa è il seguente: projects/PROJECT_ID/locations/LOCATION_ID/repositories/REPOSITORY_ID/workflowInvocations/WORKFLOW_INVOCATION_ID.
    • compilationResult o workflowConfig: il nome della risorsa dell'origine utilizzata per la chiamata.
      • Il formato del nome della risorsa per compilationResult è il seguente: projects/PROJECT_ID/locations/LOCATION_ID/repositories/REPOSITORY_ID/compilationResults/COMPILATION_RESULT_ID.
      • Il formato del nome della risorsa per workflowConfig è il seguente: projects/PROJECT_ID/locations/LOCATION_ID/repositories/REPOSITORY_ID/workflowConfigs/WORKFLOW_CONFIG_ID.
  • create_repository_context o update_repository_context: presente quando il metodo API è CreateRepository o UpdateRepository.

    • repository: il nome della risorsa del repository Dataform.
      • Il formato del nome della risorsa è il seguente: projects/PROJECT_ID/locations/LOCATION_ID/repositories/REPOSITORY_ID
  • update_release_config_context: presente quando il metodo API è UpdateReleaseConfig.

    • releaseConfig: il nome della risorsa della configurazione di rilascio.
      • Il formato del nome della risorsa è il seguente: projects/PROJECT_ID/locations/LOCATION_ID/repositories/REPOSITORY_ID/releaseConfigs/RELEASE_CONFIG_ID.
  • create_workflow_config_context o update_workflow_config_context: presente quando il metodo API è CreateWorkflowConfig o UpdateWorkflowConfig.

    • workflowConfig: il nome della risorsa della configurazione del flusso di lavoro.
      • Il formato del nome della risorsa è il seguente: projects/PROJECT_ID/locations/LOCATION_ID/repositories/REPOSITORY_ID/workflowConfigs/WORKFLOW_CONFIG_ID.

Per confrontare i formati documentati con la voce di logging, sostituisci quanto segue:

  • PROJECT_ID: l'identificatore univoco del tuo progettoGoogle Cloud .
  • LOCATION_ID: la regione in cui si trova il repository Dataform.
  • REPOSITORY_ID: l'ID definito dall'utente del repository Dataform. Questo è il nome assegnato al repository al momento della creazione.
  • COMPILATION_RESULT_ID: l'identificatore univoco generato dal sistema per un risultato di compilazione di Dataform.
  • RELEASE_CONFIG_ID: l'ID definito dall'utente della configurazione release Dataform.
  • WORKFLOW_CONFIG_ID: l'ID definito dall'utente della configurazione del workflow Dataform.

Risolvere i problemi di autorizzazione

Se trovi voci di log in cui il campo dryRunResult è false, segui questi passaggi:

  1. Nei dettagli di jsonPayload, prendi nota dell'indirizzo email nel campo caller per identificare l'entità.

  2. Prendi nota dell'indirizzo email nel campo serviceAccount per identificare il service account.

  3. Conferma che l'entità chiamante deve disporre dell'autorizzazione per agire come account di servizio. La concessione di questa autorizzazione consente al chiamante di utilizzare le autorizzazioni detenute dal service account.

  4. Se l'accesso è intenzionale, concedi il ruolo Utente service account (roles/iam.serviceAccountUser) all'entità chiamante nel service account di destinazione. Per saperne di più, consulta Concedere i ruoli IAM richiesti.

Dopo aver concesso il ruolo, i log futuri per questa combinazione di chiamante e service account dovrebbero mostrare dryRunResult: true.

Concedere i ruoli IAM richiesti

Il ruolo Utente service account (roles/iam.serviceAccountUser) contiene l'autorizzazione iam.serviceAccounts.actAs, necessaria per la modalità act-as rigorosa. Quando utilizzi l'API Dataform, devi disporre del ruolo Utente service account concesso per il service account effettivo in base al metodo projects.locations.repositories che stai chiamando:

  • create o patch
    • Se la proprietà Repository.ServiceAccount è impostata, devi disporre del ruolo Utente account di servizio concesso per quella proprietà.
    • Se chiami il metodo patch, devi disporre del ruolo Utente account di servizio concesso per tutti i service account effettivi in tutte le configurazioni del flusso di lavoro nel repository.
  • workflowConfigs.create o workflowConfigs.patch
    • Devi disporre del ruolo Utente account di servizio per l'account di servizio effettivo utilizzato nella configurazione del flusso di lavoro.
  • releaseConfigs.patch
    • Devi disporre del ruolo Utente account di servizio per tutti gli account di servizio effettivi utilizzati nelle configurazioni del flusso di lavoro utilizzando questa configurazione di rilascio.
  • workflowInvocations.create
    • Devi disporre del ruolo Utente account di servizio per l'account di servizio effettivo utilizzato nell'invocazione del workflow.

Per concedere il ruolo Utente service account a un service account personalizzato, segui questi passaggi:

  1. Nella console Google Cloud , vai a IAM > Service account.

    Vai ad Account di servizio

  2. Seleziona un progetto.

  3. Nella pagina Service account per il progetto "PROJECT_NAME", seleziona il service account personalizzato.

  4. Vai a Entità con accesso e poi fai clic su Concedi accesso.

  5. Nel campo Nuove entità, inserisci l'ID service agent Dataform predefinito.

    L'ID service agent Dataform predefinito ha il seguente formato:

    service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
    

    Sostituisci PROJECT_NUMBER con il numero del tuo progettoGoogle Cloud .

  6. Nell'elenco Seleziona un ruolo, seleziona il ruolo Utente account di servizio.

  7. Fai clic su Aggiungi un altro ruolo e seleziona il ruolo Creatore token account di servizio.

  8. Fai clic su Salva.

Per saperne di più, consulta Ruoli richiesti per creare una configurazione del workflow e Ruoli richiesti per creare una configurazione della release.

Effetti della modalità actAs rigorosa sulle release e sulle esecuzioni automatiche

Quando la modalità di emulazione rigorosa è abilitata, influisce sulle release automatiche dei repository e sulle esecuzioni automatiche dei workflow nel seguente modo:

Per i repository non connessi a repository di terze parti:

  • Non puoi impostare una pianificazione Cron per i rilasci automatici nelle configurazioni di rilascio. Questa operazione viene applicata per impedire il deployment automatico delle modifiche al codice apportate da un utente che potrebbe non disporre delle autorizzazioni iam.serviceAccounts.actAs necessarie per i service account downstream.
  • Le esecuzioni del workflow pianificate che utilizzano una pianificazione cron nelle configurazioni del workflow rimangono abilitate. Affinché queste esecuzioni automatizzate vadano a buon fine, devi concedere all'agente di servizio Dataform predefinito l'autorizzazione iam.serviceAccounts.actAs per il service account effettivo specificato nella configurazione del flusso di lavoro.

Per i repository collegati a repository di terze parti:

  • Sono consentite le release pianificate e le esecuzioni del workflow pianificate.
  • Per attivare un rilascio automatico da una configurazione di rilascio o un'esecuzione automatica da una configurazione del flusso di lavoro, devi concedere all'agente di servizio Dataform predefinito l'autorizzazione iam.serviceAccounts.actAs sul service account effettivo pertinente:
    • Per una configurazione di rilascio automatico, concedi l'autorizzazione agli account di servizio effettivi di tutte le configurazioni del flusso di lavoro attivate da questa configurazione di rilascio.
    • Per una configurazione automatica del flusso di lavoro, concedi l'autorizzazione per il service account effettivo utilizzato da quella configurazione del flusso di lavoro.

Passaggi successivi