Risolvere i problemi relativi a Dataform

Questo documento mostra come risolvere i problemi relativi a Dataform.

Accesso a BigQuery negato

Il seguente errore si verifica quando attivi una chiamata della pipeline prima di concedere a Dataform l'accesso a BigQuery:

Access Denied: Project PROJECT_ID: User does not have bigquery.jobs.create permission in project PROJECT_ID.

Per risolvere questo errore, concedi a Dataform l'accesso a BigQuery.

Il token di accesso per un repository remoto viene rifiutato

Il seguente errore si verifica quando il token di autenticazione per un repository di terze parti connesso non ha accesso a quel repository:

The access token for remote repository REPOSITORY_NAME was rejected

Per risolvere questo errore, controlla le autorizzazioni richieste nel tuo provider Git e aggiorna di conseguenza il token di autenticazione di Secret Manager. Per saperne di più sull'autenticazione dei repository Git di terze parti in Dataform, consulta Connettersi a un repository Git di terze parti.

Quota BigQuery superata

Il seguente errore si verifica quando il numero di richieste API che Dataform invia a BigQuery supera la quota BigQuery:

Quota exceeded: Your user_method exceeded quota for concurrent api requests
per user per method.

Per risolvere questo errore, riduci il numero di query parallele a meno di 250 nei seguenti modi:

Per istruzioni su come risolvere questo errore in BigQuery, consulta Risolvere i problemi relativi a quote e limiti errori.

Limite di concorrenza delle query BigQuery superato

Il seguente errore si verifica quando il numero di query simultanee eseguite su BigQuery supera il limite di concorrenza delle query BigQuery :

Exceeded rate limits: too many concurrent queries for this project_and_region

Per risolvere questo errore, riduci il numero di query parallele a meno di 250 nei seguenti modi:

Per istruzioni su come risolvere questo errore in BigQuery, consulta Risolvere i problemi relativi a quote e limiti errori.

Errori di chiamata della pipeline BigQuery

I seguenti errori si verificano durante l'esecuzione di un workflow su BigQuery:

Per risolvere questi errori, consulta Messaggi di errore di BigQuery.

Proprietà includeDependentAssertions in conflitto

Il seguente errore si verifica durante la compilazione quando il parametro includeDependentAssertions viene impostato per la stessa azione con valori diversi all'interno di un file:

Conflicting "includeDependentAssertions" properties are not allowed. Dependency
dependencyName has different values set for this property.

Per risolvere questo errore, modifica il file e rimuovi le ripetizioni in conflitto del parametro includeDependentAssertions.

Per saperne di più sull'utilizzo del parametro includeDependentAssertions per impostare le asserzioni come dipendenze, consulta Impostare le asserzioni di un'azione selezionata come dipendenze.

La compilazione non riesce

I seguenti errori si verificano durante la compilazione a causa delle dimensioni o del numero di query compilate:

  • Compilation timed out. Reduce the complexity of your project to ensure it can compile within limits.
  • Compilation exceeded its allowed heap memory limits. Reduce the complexity of your project to ensure it can compile within limits.
  • Compilation exceeded its allowed ArrayBuffer or string memory limits. Reduce the complexity of your project to ensure it can compile within limits.

Per risolvere questi errori, segui questi passaggi:

  1. Aggiorna Dataform Core all'ultima versione.
  2. Ispeziona il workflow per identificare e ridurre le inefficienze.
  3. Riduci le dimensioni delle query SQL.
  4. Riduci la quantità di operazioni JavaScript in memoria, ad esempio:

    config { config {type: "table" }}
    js {
        const tooBig = new Uint8Array(110_000_000);
    }
    SELECT ...
    
  5. Dividi il repository.

Per saperne di più sui limiti delle risorse di compilazione di Dataform, consulta Quote e limiti.

Errori di dipendenza @dataform/core

I seguenti errori si verificano durante la compilazione se la dipendenza dataform-core in package.json non è aggiornata:

Failed to resolve @dataform/core
@dataform/core version should be X.X.X or newer

La dipendenza @dataform/core è obbligatoria in package.json. Quando inizializzi il primo workspace nel repository, Dataform popola automaticamente package.json con la versione corrente di @dataform/core. Devi aggiornare @dataform/core all'ultima versione non appena viene rilasciata.

Per risolvere questi errori, aggiorna @dataform/core all'ultima versione.

Impossibile risolvere dataform.json

Il seguente errore si verifica quando inizializzi un workspace Dataform, ma il processo di inizializzazione non riesce a installare tutti i pacchetti:

Uncaught Error: Failed to resolve dataform.json

Per risolvere questo errore, apri package.json nel workspace e fai clic su Installa pacchetti.

Impossibile risolvere workflow_settings.yaml

Il seguente errore si verifica quando inizializzi un workspace Dataform, ma il processo di inizializzazione non riesce a installare tutti i pacchetti:

Uncaught Error: Failed to resolve workflow_settings.yaml

Per risolvere questo errore, apri workflow_settings.yaml nel workspace e fai clic su Installa pacchetti.

I target dei pacchetti git+ non sono supportati

Il seguente errore si verifica quando definisci i pacchetti in package.json con target con il prefisso git+:

'git+' prefixed package targets are not currently supported. However,
in most cases they can be used via a '.tar.gz' suffixed target instead.

Dataform non supporta i target dei pacchetti con il prefisso git+.

Per risolvere questo errore, genera un URL tar.gz del pacchetto e aggiorna il target del pacchetto in package.json. Per saperne di più sull'installazione dei pacchetti in Dataform, consulta Installare un pacchetto.

Autorizzazione per le credenziali dell'utente finale negata

Il seguente errore si verifica quando esegui il workload utilizzando le credenziali utente dell'Account Google, ma Dataform non dispone delle autorizzazioni necessarie:

Dataform does not have the necessary permissions to run your workload using end user credentials. Error details: Account restricted: https://accounts.google.com/info/servicerestricted?...

Questo errore può verificarsi se la tua organizzazione utilizza regole di accesso sensibile al contesto che limitano l'accesso ai Google Cloud servizi in base all'identità e al contesto dell'utente.

Per risolvere questo errore, potrebbe essere necessario aggiornare la configurazione dell'accesso sensibile al contesto per consentire a Dataform di utilizzare le credenziali utente dell'Account Google. Per farlo, devi esentare l'ID client OAuth di Dataform nella configurazione del livello di accesso. Per informazioni dettagliate sull'esenzione delle applicazioni, consulta Configurare i livelli di accesso per le applicazioni supportate.

Per ottenere l'ID client OAuth per Dataform, contatta l'assistenza clienti Google Cloud.

Timeout dell'installazione del pacchetto

Il seguente errore si verifica quando le dimensioni dei pacchetti definiti in package.json superano le dimensioni massime delle dipendenze NPM:

API request error: Package installation timed out

Per risolvere questo errore, rimuovi i pacchetti ridondanti da package.json. Assicurati che il file package.json non contenga @dataform/cli e che le dimensioni totali delle dipendenze NPM definite non superino i 200 MB.

Se le configurazioni di release fanno riferimento a commit Git, assicurati che i file package.json nei relativi target siano validi.

Autorizzazione negata per agire come account di servizio

Il seguente errore si verifica quando la modalità act-as rigorosa è abilitata e l'entità che esegue l'azione non dispone dell'autorizzazione iam.serviceAccounts.actAs sul account di servizio effettivo:

Permission denied: Principal CALLER_EMAIL is missing 'iam.serviceAccounts.actAs' permission on service account SERVICE_ACCOUNT_EMAIL.

Questo errore può verificarsi durante le seguenti azioni:

  • Creazione o aggiornamento di un repository.
  • Creazione o aggiornamento di una configurazione del flusso di lavoro.
  • Creazione di una chiamata del workflow.
  • Aggiornamento di una configurazione di release.

Per risolvere questo errore, concedi all'entità il ruolo Utente account di servizio (roles/iam.serviceAccountUser) sul service account effettivo. Per saperne di più, consulta Concedere i ruoli IAM richiesti.

Il service account non è visibile nel menu a discesa

Quando configuri un repository o una chiamata del workflow, il menu Service account potrebbe non elencare un account di servizio personalizzato esistente.

Dataform utilizza l'API Identity and Access Management per elencare i service account. È necessaria l'autorizzazione iam.serviceAccounts.list a livello di progetto.

Per risolvere questo problema, procedi in uno dei seguenti modi:

  • Fai clic su Inserisci manualmente e inserisci l'ID del account di servizio.
  • Chiedi all'amministratore del progetto di concederti il ruolo Visualizzatore account di servizio (roles/iam.serviceAccountViewer) o un altro ruolo che includa l'autorizzazione iam.serviceAccounts.list sul progetto.

Impossibile raggiungere il registro dei pacchetti privati

Il seguente errore si verifica quando l'autenticazione Dataform per un pacchetto privato scade:

Permission denied when fetching one or more npm packages. Please verify that
private registry authentication details are valid for each npm registry

Per risolvere questo errore, verifica che i dettagli di autenticazione del registro privato siano validi per ogni registro NPM. Per saperne di più, consulta Autenticare un pacchetto privato.

Impossibile raggiungere il repository remoto

Il seguente errore si verifica a causa dell'instabilità di Git o quando la connessione al repository di terze parti non è stata configurata correttamente:

Remote repository REPOSITORY_NAME could not be reached.

Per risolvere questo errore, verifica di aver seguito tutti i passaggi elencati in Connettersi a un repository Git di terze parti. In particolare, verifica che l'host del repository Git sia accessibile da internet pubblico. Inoltre, verifica che il token di autenticazione o la chiave privata siano corretti e dispongano delle autorizzazioni necessarie per accedere al repository.

Impossibile raggiungere il repository remoto: generic::invalid_argument

Il seguente errore si verifica nella pagina Dettagli configurazioni di release quando un rilascio programmato incontra occasionalmente una connessione GitHub, GitLab o Bitbucket lenta, instabile o interrotta:

generic::invalid_argument: Remote repository 'REMOTE_REPOSITORY_URL' could not be reached.

Non è necessario intraprendere alcuna azione. A meno che i problemi di GitHub, GitLab o Bitbucket Cloud non persistano, le release pianificate successive possono avere esito positivo.

Impossibile raggiungere il secret per un repository remoto

Il seguente errore si verifica quando l'agente di servizio o il account di servizio Dataform non riesce ad accedere al secret di Secret Manager per un repository di terze parti connesso:

Dataform's service account is unable to reach the configured secret.
Make sure the secret exists and is shared with your Dataform service account:
SERVICE_ACCOUNT_ID.

Per risolvere questo errore:

  • Verifica che l'agente di servizio o il account di servizio Dataform abbia accesso al secret.
  • Escludi il secret dal perimetro di servizio VPC-SC. Al momento Dataform non supporta VPC-SC.

Argomento sconosciuto: tag

Il seguente errore si verifica quando la versione della CLI Dataform non riconosce l'argomento tags:

Unknown argument: tags

Per risolvere questo errore:

  • Aggiorna la versione della CLI a 3.0.0 o successive. Esegui sempre il test delle nuove versioni dei pacchetti in un ambiente non di produzione prima di eseguirne il deployment nell'ambiente di produzione.
  • Come best practice, utilizza sempre l'ultima versione disponibile del pacchetto Dataform Core.
  • Specifica esplicitamente la versione del pacchetto in package.json, ad esempio 3.0.0. Non utilizzare altre dependencies opzioni di package.json, ad esempio >version.