Questo documento mostra come connettere un repository remoto a un repository Dataform. Dopo aver collegato i repository, le modifiche apportate in un workspace di sviluppo Dataform possono essere inviate al repository Git remoto ed estratte da questo.
Puoi connettere un repository remoto tramite HTTPS o SSH.
La tabella seguente elenca i provider Git supportati e i metodi di connessione disponibili per i relativi repository:
| Provider Git | Metodo di connessione |
|---|---|
| Azure DevOps Services | SSH |
| Bitbucket | SSH |
| GitHub | SSH o HTTPS |
| GitLab | SSH o HTTPS |
Prima di iniziare
- Se la tua organizzazione o il tuo progetto limita i repository Git remoti
con la policy dell'organizzazione
dataform.restrictGitRemotes, assicurati che il repository Git remoto sia aggiunto alla lista consentita nella policy prima di creare un repository Dataform che vuoi connettere a un repository remoto. Per saperne di più, consulta Limitare i repository remoti. - Seleziona o crea un repository Dataform. Ti servirà in un secondo momento per condividere un secret con l'agente di servizio Dataform predefinito.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per connettere un repository Dataform a un repository Git remoto, chiedi all'amministratore di concederti il ruolo IAM Dataform Admin (roles/dataform.admin) sui repository.
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Connetti un repository remoto tramite SSH
Per connettere un repository remoto tramite SSH, devi generare una chiave SSH e un secret di Secret Manager. La chiave SSH è composta da una chiave SSH pubblica e una chiave SSH privata. Devi condividere la chiave SSH pubblica con il tuo provider Git e creare un secret Secret Manager con la chiave SSH privata. Quindi, condividi il secret con il service agent Dataform predefinito.
Dataform utilizza il secret con la chiave SSH privata per accedere al tuo provider Git per eseguire il commit delle modifiche per conto degli sviluppatori. Dataform esegue questi commit utilizzando l'indirizzo email Google Cloud dello sviluppatore, in modo che tu possa sapere chi ha eseguito ogni commit.
Per connettere un repository remoto a un repository Dataform tramite SSH:
Nel tuo provider Git:
Azure DevOps Services
- In Azure DevOps Services, crea una chiave SSH privata.
- Carica la chiave SSH pubblica nel repository Azure DevOps Services.
Bitbucket
- In Bitbucket, crea una chiave SSH privata.
- Carica la chiave SSH pubblica nel tuo repository Bitbucket.
GitHub
- In GitHub, crea una chiave SSH privata.
- Carica la chiave SSH pubblica di GitHub nel tuo repository GitHub.
GitLab
- In GitLab, crea una chiave SSH privata.
- Carica la chiave SSH pubblica di GitLab nel tuo repository GitLab.
In Secret Manager, crea un secret e imposta la chiave SSH privata come valore del secret.
Concedi l'accesso al secret all'agente di servizio Dataform predefinito.
L'agente di servizio Dataform predefinito ha il seguente formato:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.comConcedi il ruolo
roles/secretmanager.secretAccessorall'agente di servizio o al account di servizio.
Nella console Google Cloud , vai alla pagina Dataform.
Seleziona il repository Dataform a cui vuoi connetterti al repository remoto.
Nella pagina del repository, fai clic su Impostazioni > Connetti a Git.
Nel riquadro Link al repository remoto, nel campo URL repository Git remoto, inserisci l'URL del repository Git remoto, che termina con
.git.L'URL del repository Git remoto deve essere in uno dei seguenti formati:
- URL assoluto:
ssh://git@{host_name}[:{port}]/{repository_path},portè facoltativo. - URL simile a SCP:
git@{host_name}:{repository_path}.
- URL assoluto:
Nel campo Nome del ramo remoto predefinito, inserisci il nome del ramo di sviluppo principale del repository Git remoto.
Nel menu a discesa Secret, seleziona il secret per il repository Git remoto.
Nel campo Valore chiave host pubblica SSH, inserisci la chiave host pubblica del tuo provider Git.
Azure DevOps Services
Per recuperare la chiave host pubblica di Azure DevOps Services, esegui questo comando nel terminale:
ssh-keyscan -t rsa ssh.dev.azure.comCopia una delle chiavi generate, omettendo
ssh.dev.azure.comdall'inizio della riga. Il valore che copi deve avere il seguente formato:ALGORITHM BASE64_KEY_VALUEAd esempio:
ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABAQC7Hr1oTWqNqOlzGJOfGJ4NakVyIzf1rXYd4d7wo6jBlkLvCA4odBlL0mDUyZ0/QUfTTqeu+tm22gOsv+VrVTMk6vwRU75gY/y9ut5Mb3bR5BV58dKXyq9A9UeB5Cakehn5Zgm6x1mKoVyf+FFn26iYqXJRgzIZZcZ5V6hrE0Qg39kZm4az48o0AUbf6Sp4SLdvnuMa2sVNwHBboS7EJkm57XQPVU3/QpyNLHbWDdzwtrlS+ez30S3AdYhLKEOxAG8weOnyrtLJAUen9mTkol8oII1edf7mWWbWVf0nBmly21+nZcmCTISQBtdcyPaEno7fFQMDD26/s0lfKob4Kw8HVerifica che questa chiave sia ancora aggiornata con Azure DevOps Services.
Bitbucket
Per recuperare la chiave host pubblica di Bitbucket, esegui questo comando nel terminale:
curl https://bitbucket.org/site/sshIl comando restituisce un elenco di chiavi host pubbliche. Scegli una delle chiavi dall'elenco, copiala omettendo
bitbucket.orgdall'inizio della riga. Il valore che copi deve avere il seguente formato:ALGORITHM BASE64_KEY_VALUEAd esempio:
ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIIazEu89wgQZ4bqs3d63QSMzYVa0MuJ2e2gKTKqu+UUOVerifica che questa chiave sia ancora aggiornata con Bitbucket.
GitHub
- Per recuperare la chiave host pubblica di GitHub, vedi Impronte delle chiavi SSH di GitHub.
La pagina contiene un elenco di chiavi host pubbliche. Scegli una delle opzioni e copiala, omettendo
github.comdall'inizio della riga. Il valore che copi deve avere il seguente formato:ALGORITHM BASE64_KEY_VALUEAd esempio:
ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIOMqqnkVzrm0SdG6UOoqKLsabgH5C9okWi0dh2l9GKJlVerifica che questa chiave sia ancora aggiornata con GitHub.
GitLab
- Per recuperare la chiave host pubblica di GitLab, consulta le voci SSH
known_hosts. La pagina contiene un elenco di chiavi host pubbliche. Scegli una delle opzioni e copiala, omettendo
gitlab.comdall'inizio della riga. Il valore che copi deve avere il seguente formato:ALGORITHM BASE64_KEY_VALUEAd esempio:
ssh-ed25519 AAAAC3NzaC1lZDI1NTE5AAAAIAfuCHKVTjquxvt6CM6tdG4SLp1Btn/nOeHHE5UOzRdfVerifica che questa chiave sia ancora aggiornata con GitLab.
Fai clic su Collega.
Connettere un repository remoto tramite HTTPS
Per connettere un repository remoto tramite HTTPS, devi creare un secret di Secret Manager con un token di accesso personale e condividerlo con l'agente di servizio Dataform predefinito.
Dataform utilizza quindi il token di accesso per accedere al provider Git e commitare le modifiche per conto degli sviluppatori. Dataform esegue questi commit utilizzando l'indirizzo email Google Cloud dello sviluppatore, in modo che tu possa sapere chi ha eseguito ogni commit.
Per connettere un repository remoto a un repository Dataform tramite HTTPS, segui questi passaggi:
Nel tuo provider Git:
GitHub
In GitHub, crea un token di accesso personale granulare o un token di accesso personale classico.
- Per un token di accesso personale GitHub granulare:
Seleziona l'accesso al repository solo ai repository selezionati, quindi seleziona il repository a cui vuoi connetterti.
Concedi l'accesso in lettura e scrittura ai contenuti del repository.
Imposta un tempo di scadenza del token appropriato alle tue esigenze.
- Per un token di accesso personale GitHub classico:
Concedi a Dataform l'autorizzazione
repo.Imposta un tempo di scadenza del token appropriato alle tue esigenze.
Se la tua organizzazione utilizza il Single Sign-On (SSO) SAML, autorizza il token.
GitLab
In GitLab, crea un token di accesso personale GitLab.
Assegna al token il nome
dataform.Il token di accesso personale di GitLab deve essere denominato
dataform.Concedi a Dataform le autorizzazioni
api,read_repositoryewrite_repository.Imposta un tempo di scadenza del token appropriato alle tue esigenze.
In Secret Manager, crea un secret contenente il token di accesso personale del repository remoto.
Concedi l'accesso al secret all'agente di servizio Dataform predefinito.
L'agente di servizio Dataform predefinito ha il seguente formato:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com- Concedi il
ruolo
roles/secretmanager.secretAccessoral service agent.
- Concedi il
ruolo
Nella console Google Cloud , vai alla pagina Dataform.
Seleziona il repository Dataform a cui vuoi connetterti al repository remoto.
Nella pagina del repository, fai clic su Impostazioni > Connetti a Git.
Nel riquadro Link al repository remoto, nel campo URL repository Git remoto, inserisci l'URL del repository Git remoto, che termina con
.git.L'URL del repository Git remoto non può contenere nomi utente o password.
Nel campo Nome del ramo remoto predefinito, inserisci il nome del ramo di sviluppo principale del repository Git remoto.
Nel menu a discesa Secret, seleziona il secret per il repository Git remoto.
Fai clic su Collega.
Modificare la connessione al repository remoto
Per modificare una connessione tra un repository Dataform e un repository Git remoto:
Nella console Google Cloud , vai alla pagina Dataform.
Fai clic sul repository che vuoi modificare.
Nella pagina del repository, fai clic su Impostazioni > Modifica connessione Git.
Nel riquadro Link al repository remoto, modifica le impostazioni di connessione.
Fai clic su Aggiorna.
Passaggi successivi
Per scoprire di più sui repository Dataform, consulta Creare un repository.
Per creare un workspace di sviluppo, consulta Crea un workspace.
Per scoprire come risolvere i problemi relativi alle connessioni ai repository remoti, consulta la sezione Risolvere i problemi di Dataform.