Cloud Composer 3 | Cloud Composer 2 | Cloud Composer 1
Questa pagina spiega come creare un ambiente Cloud Composer.
- Per maggiori informazioni sugli ambienti, consulta Architettura dell'ambiente.
- Per saperne di più sulla creazione di un ambiente con Terraform, consulta Crea ambienti (Terraform).
Prima di iniziare
. Puoi comunque creare ambienti Cloud Composer 1 tramite Google Cloud CLI, Terraform e API se il tuo progetto supporta la creazione di nuovi ambienti Cloud Composer 1.Abilita l'API Cloud Composer. Per l'elenco completo dei servizi utilizzati da Cloud Composer, consulta Servizi richiesti da Cloud Composer.
Il tempo approssimativo per creare un ambiente è di 25 minuti.
Se crei un ambiente con Terraform, il account di servizio utilizzato da Terraform deve avere un ruolo con l'autorizzazione
composer.environments.createabilitata.Per saperne di più sul account di servizio per Terraform, consulta Guida di riferimento alla configurazione del provider Google.
Per saperne di più sull'utilizzo di Terraform per creare un ambiente Cloud Composer, consulta la documentazione di Terraform.
Per ulteriori informazioni sui parametri aggiuntivi, consulta la documentazione di riferimento sugli argomenti di Terraform.
IP privato: esistono requisiti specifici per la rete e il peering per creare un ambiente IP privato. Per ulteriori informazioni, vedi Configurazione dell'IP privato.
VPC condiviso: esistono requisiti di rete specifici per utilizzare VPC condiviso con Cloud Composer. Per informazioni, consulta la pagina Configurazione del VPC condiviso.
VPC SC: per eseguire il deployment degli ambienti Cloud Composer all'interno di un perimetro di sicurezza, consulta Configurazione di VPC SC. Se utilizzati con Cloud Composer, i Controlli di servizio VPC presentano diverse limitazioni note.
Passaggio 1: Crea o scegli il account di servizio di un ambiente
Quando crei un ambiente, specifichi un account di servizio. Questo service account è chiamato service account dell'ambiente. Il tuo ambiente utilizza questo account di servizio per eseguire la maggior parte delle operazioni.
Il account di servizio per il tuo ambiente non è un account utente. Un account di serviziot è un particolare tipo di account utilizzato da un'applicazione o da un'istanza di macchina virtuale (VM), non da una persona fisica.
Non puoi modificare il account di servizio del tuo ambiente in un secondo momento.
Se non hai ancora un account di servizio per gli ambienti Cloud Composer nel tuo progetto, crealo.
Consulta Creare ambienti (Terraform) per un esempio esteso di creazione di un account di servizio per il tuo ambiente in Terraform.
Per creare un nuovo account di servizio per il tuo ambiente:
Crea un nuovo service account come descritto nella documentazione di Identity and Access Management.
Assegna un ruolo, come descritto nella documentazione di Identity and Access Management. Il ruolo richiesto è Worker Composer (
composer.worker).Se il tuo ambiente utilizza limitazioni della località delle risorse, o installa pacchetti PyPI da un repository Artifact Registry o da un repository privato, concedi il ruolo Utente service account (
iam.serviceAccountUser) all'service account gestito dall'utente che esegue il tuo ambiente su se stesso (sia l'entità che la risorsa sono lo stesso account di servizio).Per accedere ad altre risorse nel tuo progetto Google Cloud , concedi autorizzazioni aggiuntive per accedere a queste risorse a questo account di servizio. Il ruolo Worker Composer (
composer.worker) fornisce questo insieme di autorizzazioni richiesto nella maggior parte dei casi. Aggiungi autorizzazioni aggiuntive a questo service account solo quando è necessario per il funzionamento dei tuoi DAG.
Passaggio 2: Impostazione di base
Questo passaggio crea un ambiente Cloud Composer con parametri predefiniti nella posizione specificata.
Console
Nella console Google Cloud , vai alla pagina Crea ambiente.
Nel campo Nome, inserisci un nome per l'ambiente.
Il nome deve iniziare con una lettera minuscola seguita da un massimo di 62 lettere minuscole, numeri o trattini e non può terminare con un trattino. Il nome dell'ambiente viene utilizzato per creare i sottocomponenti dell'ambiente, pertanto devi fornire un nome valido anche come nome del bucket Cloud Storage. Consulta le linee guida per la denominazione dei bucket per un elenco di limitazioni.
Nell'elenco a discesa Località, scegli una località per il tuo ambiente.
Una località è la regione in cui si trova l'ambiente.
Nell'elenco a discesa Versione immagine, seleziona un'immagine Cloud Composer con la versione richiesta di Airflow.
Nella sezione Configurazione nodo, seleziona un account di servizio per il tuo ambiente dall'elenco a discesa Service account.
Se non hai ancora un service account per il tuo ambiente, vedi Creare o scegliere un service account per l'ambiente.
gcloud
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version IMAGE_VERSION \
--service-account "SERVICE_ACCOUNT"
Sostituisci:
ENVIRONMENT_NAMEcon il nome dell'ambiente.Il nome deve iniziare con una lettera minuscola seguita da un massimo di 62 lettere minuscole, numeri o trattini e non può terminare con un trattino. Il nome dell'ambiente viene utilizzato per creare i sottocomponenti dell'ambiente, pertanto devi fornire un nome valido anche come nome del bucket Cloud Storage. Consulta le linee guida per la denominazione dei bucket per un elenco di limitazioni.
LOCATIONcon la regione per l'ambiente.Una località è la regione in cui si trova l'ambiente.
SERVICE_ACCOUNTcon il account di servizio per il tuo ambiente.IMAGE_VERSION: il nome di un'immagine di Cloud Composer.
Esempio:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
"
API
Crea una richiesta API environments.create. Specifica la
configurazione nella risorsa Environment.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"softwareConfig": {
"imageVersion": "IMAGE_VERSION"
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
PROJECT_IDcon l'ID progetto.LOCATIONcon la regione per l'ambiente.Una località è la regione in cui si trova l'ambiente.
ENVIRONMENT_NAMEcon il nome dell'ambiente.Il nome deve iniziare con una lettera minuscola seguita da un massimo di 62 lettere minuscole, numeri o trattini e non può terminare con un trattino. Il nome dell'ambiente viene utilizzato per creare i sottocomponenti dell'ambiente, pertanto devi fornire un nome valido anche come nome del bucket Cloud Storage. Consulta le linee guida per la denominazione dei bucket per un elenco di limitazioni.
IMAGE_VERSION: il nome di un'immagine di Cloud Composer.SERVICE_ACCOUNTcon il account di servizio per il tuo ambiente.
Esempio:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"softwareConfig": {
"imageVersion": "composer-1.20.12-airflow-1.10.15"
},
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Per creare un ambiente con parametri predefiniti in una posizione specificata,
aggiungi il seguente blocco di risorse alla configurazione Terraform ed esegui
terraform apply.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
software_config {
image_version = "IMAGE_VERSION"
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
ENVIRONMENT_NAMEcon il nome dell'ambiente.Il nome deve iniziare con una lettera minuscola seguita da un massimo di 62 lettere minuscole, numeri o trattini e non può terminare con un trattino. Il nome dell'ambiente viene utilizzato per creare i sottocomponenti dell'ambiente, pertanto devi fornire un nome valido anche come nome del bucket Cloud Storage. Consulta le linee guida per la denominazione dei bucket per un elenco di limitazioni.
LOCATIONcon la regione per l'ambiente.Una località è la regione in cui si trova l'ambiente.
IMAGE_VERSION: il nome di un'immagine di Cloud Composer.SERVICE_ACCOUNTcon il account di servizio per il tuo ambiente.
Esempio:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
software_config {
image_version = "composer-1.20.12-airflow-1.10.15"
}
node_config {
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Passaggio 3: (Facoltativo) Configurare i parametri di scalabilità e rendimento dell'ambiente
Per specificare la configurazione di scalabilità e prestazioni per il tuo ambiente, fornisci il numero di nodi nel cluster GKE del tuo ambiente e seleziona i tipi di macchine per i componenti dell'ambiente.
Console
Nella pagina Crea ambiente:
Nella sezione Configurazione del nodo:
Inserisci il numero di nodi.
Il conteggio dei nodi è il numero di nodi Google Kubernetes Engine nel cluster dell'ambiente. Per impostazione predefinita, gli ambienti hanno 3 nodi.
Puoi modificare questo valore dopo aver creato l'ambiente.
Scegli il tipo di macchina per i nodi.
Il tipo di macchina per i nodi è Tipo di macchina Compute Engine utilizzato per le istanze di cluster. Questo parametro determina il numero di CPU e la quantità di memoria per il tuo ambiente. Il tipo di macchina predefinito è
n1-standard-1.Per modificare questo valore dopo aver creato l'ambiente, devi riconfigurare manualmente il cluster dell'ambiente.
Inserisci le Dimensioni del disco.
La dimensione del disco, in GB, per i nodi dell'ambiente. Ogni nodo nel tuo ambiente ha questa quantità di spazio su disco. Seleziona una dimensione del disco maggiore se prevedi di archiviare un volume elevato di dati nelle cartelle sincronizzate con le VM dell'ambiente. Ad esempio, nella cartella
/datadel bucket dell'ambiente.La dimensione minima è 30 GB. La dimensione predefinita è 100 GB. Non puoi modificare questo parametro dopo aver creato un ambiente.
Scegli il Numero di pianificazioni.
Il tuo ambiente può eseguire più di uno scheduler Airflow contemporaneamente. Utilizza più scheduler per distribuire il carico tra diverse istanze dello scheduler in modo da migliorare i livelli di prestazioni e affidabilità.
L'aumento del numero di scheduler non sempre migliora le prestazioni di Airflow. Ad esempio, avere un solo scheduler potrebbe fornire prestazioni migliori rispetto ad averne due. Ciò può accadere quando lo scheduler aggiuntivo non viene utilizzato e quindi consuma risorse del tuo ambiente senza contribuire al rendimento complessivo. Le prestazioni effettive dello scheduler dipendono dal numero di worker Airflow, dal numero di DAG e attività eseguiti nel tuo ambiente e dalla configurazione di Airflow e dell'ambiente.
Ti consigliamo di iniziare con due scheduler e poi monitorare il rendimento del tuo ambiente. Se modifichi il numero di scheduler, puoi sempre scalare l'ambiente al numero originale di scheduler.
Per saperne di più sulla configurazione di più scheduler, consulta la documentazione di Airflow.
Espandi l'elemento Networking, override della configurazione di Airflow e funzionalità aggiuntive.
Nella sezione Configurazione Cloud SQL, scegli Tipo di macchina Cloud SQL.
Questo parametro determina il tipo di macchina per l'istanza Cloud SQL che esegue il database Airflow. Il tipo di macchina Cloud SQL predefinito è
db-n1-standard-2.Nella sezione Configurazione server web, scegli Tipo di macchina del server web.
Questo parametro determina il tipo di macchina per l'istanza di Compute Engine che esegue il server web Airflow.
Il tipo di macchina server web predefinito è
composer-n1-webserver-2.
gcloud
Quando crei un ambiente, i seguenti argomenti controllano i parametri di scalabilità e prestazioni dell'ambiente:
--node-countspecifica il numero di nodi nel tuo ambiente.Il conteggio dei nodi è il numero di nodi Google Kubernetes Engine nel cluster dell'ambiente. Per impostazione predefinita, gli ambienti hanno 3 nodi.
Puoi modificare questo valore dopo aver creato l'ambiente.
--scheduler-countspecifica il numero di scheduler nel tuo ambiente.Il tuo ambiente può eseguire più di uno scheduler Airflow contemporaneamente. Utilizza più scheduler per distribuire il carico tra diverse istanze dello scheduler in modo da migliorare i livelli di prestazioni e affidabilità.
L'aumento del numero di scheduler non sempre migliora le prestazioni di Airflow. Ad esempio, avere un solo scheduler potrebbe fornire prestazioni migliori rispetto ad averne due. Ciò può accadere quando lo scheduler aggiuntivo non viene utilizzato e quindi consuma risorse del tuo ambiente senza contribuire al rendimento complessivo. Le prestazioni effettive dello scheduler dipendono dal numero di worker Airflow, dal numero di DAG e attività eseguiti nel tuo ambiente e dalla configurazione di Airflow e dell'ambiente.
Ti consigliamo di iniziare con due scheduler e poi monitorare il rendimento del tuo ambiente. Se modifichi il numero di scheduler, puoi sempre scalare l'ambiente al numero originale di scheduler.
Per saperne di più sulla configurazione di più scheduler, consulta la documentazione di Airflow.
--disk-sizespecifica la dimensione del disco per le VM dell'ambiente.La dimensione del disco, in GB, per i nodi dell'ambiente. Ogni nodo nel tuo ambiente ha questa quantità di spazio su disco. Seleziona una dimensione del disco maggiore se prevedi di archiviare un volume elevato di dati nelle cartelle sincronizzate con le VM dell'ambiente. Ad esempio, nella cartella
/datadel bucket dell'ambiente.La dimensione minima è 30 GB. La dimensione predefinita è 100 GB. Non puoi modificare questo parametro dopo aver creato un ambiente.
--machine-typespecifica il tipo di macchina per le VM dei nodi.Il tipo di macchina per i nodi è Tipo di macchina Compute Engine utilizzato per le istanze di cluster. Questo parametro determina il numero di CPU e la quantità di memoria per il tuo ambiente. Il tipo di macchina predefinito è
n1-standard-1.Per modificare questo valore dopo aver creato l'ambiente, devi riconfigurare manualmente il cluster dell'ambiente.
--cloud-sql-machine-typespecifica il tipo di macchina per l'istanza Cloud SQL.Questo parametro determina il tipo di macchina per l'istanza Cloud SQL che esegue il database Airflow. Il tipo di macchina Cloud SQL predefinito è
db-n1-standard-2.--web-server-machine-typespecifica il tipo di macchina per l'istanza del server web Airflow.Questo parametro determina il tipo di macchina per l'istanza di Compute Engine che esegue il server web Airflow.
Il tipo di macchina server web predefinito è
composer-n1-webserver-2.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "SERVICE_ACCOUNT" \
--zone NODE_ZONE \
--node-count NODE_COUNT \
--scheduler-count SCHEDULER_COUNT \
--disk-size DISK_SIZE \
--machine-type NODE_MACHINE_TYPE \
--cloud-sql-machine-type SQL_MACHINE_TYPE \
--web-server-machine-type WS_MACHINE_TYPE
Sostituisci:
NODE_COUNTcon il numero di nodi.NODE_ZONEcon la zona di Compute Engine per le VM del tuo ambiente.SCHEDULER_COUNTcon il numero di scheduler.DISK_SIZEcon la dimensione del disco per le VM dell'ambiente, in GB.NODE_MACHINE_TYPEcon il tipo di macchina per le VM dei nodi.SQL_MACHINE_TYPEcon il tipo di macchina per l'istanza Cloud SQL.WS_MACHINE_TYPEcon il tipo di macchina per l'istanza del server web Airflow.
Esempio:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--zone us-central1-a \
--node-count 6 \
--scheduler-count 1 \
--disk-size 50 \
--machine-type n1-standard-2 \
--cloud-sql-machine-type db-n1-standard-2 \
--web-server-machine-type composer-n1-webserver-2
API
Quando crei un ambiente, nella risorsa Environment > EnvironmentConfig, specifica i parametri di scalabilità e prestazioni dell'ambiente.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"nodeCount": NODE_COUNT,
"nodeConfig": {
"machineType": "NODE_MACHINE_TYPE",
"diskSizeGb": DISK_SIZE,
"serviceAccount": "SERVICE_ACCOUNT"
},
"softwareConfig": {
"schedulerCount": SCHEDULER_COUNT
},
"databaseConfig": {
"machineType": "SQL_MACHINE_TYPE"
},
"webServerConfig": {
"machineType": "WS_MACHINE_TYPE"
}
}
}
Sostituisci:
NODE_COUNTcon il numero di nodi.DISK_SIZEcon la dimensione del disco per le VM dell'ambiente, in GB.NODE_MACHINE_TYPEcon il tipo di macchina per le VM dei nodi. Questo valore deve contenere una zona per le VM dell'ambiente.SCHEDULER_COUNTcon il numero di scheduler.SQL_MACHINE_TYPEcon il tipo di macchina per l'istanza Cloud SQL.WS_MACHINE_TYPEcon il tipo di macchina per l'istanza del server web Airflow.
Esempio:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"nodeCount": 6,
"nodeConfig": {
"machineType": "projects/example-project/zones/us-central1-a/machineTypes/n1-standard-2",
"diskSizeGb": 50,
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
},
"softwareConfig": {
"schedulerCount": 1
},
"databaseConfig": {
"machineType": "db-n1-standard-2"
},
"webServerConfig": {
"machineType": "composer-n1-webserver-2"
}
}
}
Terraform
Quando crei un ambiente, i seguenti campi controllano i parametri di scalabilità e prestazioni dell'ambiente:
node_countnel blocconode_configspecifica il numero di nodi nel tuo ambiente.Il conteggio dei nodi è il numero di nodi Google Kubernetes Engine nel cluster dell'ambiente. Per impostazione predefinita, gli ambienti hanno 3 nodi.
Puoi modificare questo valore dopo aver creato l'ambiente.
disk_size_gbnel blocconode_configspecifica le dimensioni del disco per le VM dell'ambiente.La dimensione del disco, in GB, per i nodi dell'ambiente. Ogni nodo nel tuo ambiente ha questa quantità di spazio su disco. Seleziona una dimensione del disco maggiore se prevedi di archiviare un volume elevato di dati nelle cartelle sincronizzate con le VM dell'ambiente. Ad esempio, nella cartella
/datadel bucket dell'ambiente.La dimensione minima è 30 GB. La dimensione predefinita è 100 GB. Non puoi modificare questo parametro dopo aver creato un ambiente.
machine_typenel blocconode_configspecifica il tipo di macchina per le VM dei nodi. Quando specifichi questo campo, fornisci anche una zona Compute Engine per le VM dell'ambiente nel campozone.Il tipo di macchina per i nodi è Tipo di macchina Compute Engine utilizzato per le istanze di cluster. Questo parametro determina il numero di CPU e la quantità di memoria per il tuo ambiente. Il tipo di macchina predefinito è
n1-standard-1.Per modificare questo valore dopo aver creato l'ambiente, devi riconfigurare manualmente il cluster dell'ambiente.
machine_typenel bloccodatabase_configspecifica il tipo di macchina per l'istanza Cloud SQL.Questo parametro determina il tipo di macchina per l'istanza Cloud SQL che esegue il database Airflow. Il tipo di macchina Cloud SQL predefinito è
db-n1-standard-2.machine_typenel bloccoweb_server_configspecifica il tipo di macchina per l'istanza del server web Airflow.Questo parametro determina il tipo di macchina per l'istanza di Compute Engine che esegue il server web Airflow.
Il tipo di macchina server web predefinito è
composer-n1-webserver-2.Il campo
scheduler_countnel bloccosoftware_configspecifica il numero di scheduler nel tuo ambiente. Il tuo ambiente deve utilizzare Airflow 2.
resource "google_composer_environment" "example" {
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
node_config {
node_count = NODE_COUNT
disk_size_gb = DISK_SIZE
machine_type = "NODE_MACHINE_TYPE"
zone = "NODE_ZONE"
service_account = "SERVICE_ACCOUNT"
}
software_config {
scheduler_count = SCHEDULER_COUNT
}
database_config {
machine_type = "SQL_MACHINE_TYPE"
}
web_server_config {
machine_type = "WS_MACHINE_TYPE"
}
}
}
Sostituisci:
NODE_COUNTcon il numero di nodi.DISK_SIZEcon la dimensione del disco per le VM dell'ambiente, in GB.NODE_MACHINE_TYPEcon il tipo di macchina per le VM dei nodi.NODE_ZONEcon la zona di Compute Engine per le VM del tuo ambiente.SCHEDULER_COUNTcon il numero di scheduler.SQL_MACHINE_TYPEcon il tipo di macchina per l'istanza Cloud SQL.WS_MACHINE_TYPEcon il tipo di macchina per l'istanza del server web Airflow.
Esempio:
resource "google_composer_environment" "example" {
name = "example-environment"
region = "us-central1"
config {
node_config {
node_count = 4
disk_size_gb = 100
zone = "us-central1-a"
machine_type = "n1-standard-2"
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
software_config {
scheduler_count = 2
}
database_config {
machine_type = "db-n1-standard-2"
}
web_server_config {
machine_type = "composer-n1-webserver-2"
}
}
}
Passaggio 4: (Facoltativo) Configura il networking del tuo ambiente
I parametri di Networking dipendono dal tipo di ambiente che vuoi creare:
Ambiente IP pubblico. Utilizza i parametri di rete predefiniti.
Ambiente IP privato (peering VPC). In questa configurazione, il tuo ambiente utilizza i peering VPC per la connettività.
Configura l'ambiente IP privato:
- Configura il networking del tuo progetto per gli ambienti IP privati.
- Specifica altri parametri per l'ambiente IP privato, come descritto più avanti in questa sezione.
Per un ambiente IP privato con peering VPC, devi sapere:
- L'ID rete VPC
- ID subnet VPC
Due intervalli IP secondari nella subnet VPC:
- Intervallo IP secondario per i pod
- Intervallo IP secondario per i servizi
Intervalli IP per i componenti dell'ambiente:
- Intervallo IP per il control plane GKE.
- Intervallo IP del server web.
- Intervallo IP per l'istanza Cloud SQL.
Per un ambiente VPC condiviso, devi eseguire una configurazione di rete aggiuntiva per il progetto host, quindi creare un ambiente IP pubblico o privato in un progetto di servizio. Segui le istruzioni riportate nella pagina Configurazione del VPC condiviso.
Per un ambiente VPC condiviso, devi sapere:
- L'ID rete VPC del progetto host
L'ID subnet VPC del progetto host
Due intervalli IP secondari nella subnet VPC del progetto host:
- Intervallo IP secondario per i pod
- Intervallo IP secondario per i servizi
Quando crei un ambiente VPC condiviso con IP pubblico, devi comunque specificare la rete VPC, la subnet e gli intervalli IP secondari del progetto host per pod e servizi.
Per creare un ambiente VPC SC, devi creare un perimetro di servizio e poi creare ambienti IP privati all'interno di questo perimetro. Segui le istruzioni descritte in Configurazione dei Controlli di servizio VPC.
Le opzioni di networking aggiuntive per gli ambienti sono:
- Indirizzi IP pubblici utilizzati privatamente. Se vuoi utilizzare più indirizzi IP, il tuo ambiente può utilizzare privatamente determinati intervalli di indirizzi IP pubblici come intervalli di indirizzi IP interni e di subnet per pod e servizi.
- Reti autorizzate. Se vuoi accedere al control plane del tuo ambiente IP privato utilizzando HTTPS, puoi utilizzare le reti autorizzate per specificare gli intervalli CIDR che possono farlo.
- Agente di mascheramento IP. Utilizzando gli ambienti con l'agente di mascheramento IP, puoi utilizzare traduzioni molti-a-uno degli indirizzi IP nelle configurazioni di rete del tuo ambiente. Per saperne di più sulla creazione di ambienti con l'agente di mascheramento IP, consulta Abilitazione dell'agente di mascheramento IP.
Console
Per creare un ambiente IP privato:
Assicurati che la rete sia configurata per il tipo di ambiente che vuoi creare.
Espandi l'elemento Networking, override della configurazione di Airflow e funzionalità aggiuntive.
Nella sezione Configurazione di rete, seleziona la casella di controllo Abilita rete VPC nativa (mediante IP alias).
Nell'elenco a discesa Rete, seleziona l'ID rete VPC.
Nell'elenco a discesa Subnet, seleziona l'ID subnet VPC.
Nella sezione Allocazione indirizzi IP pod, specifica l'intervallo IP secondario per i pod. Puoi utilizzare un intervallo secondario esistente nella tua rete VPC o specificarne uno nuovo nella notazione CIDR.
Nella sezione Allocazione indirizzi IP del servizio, specifica l'intervallo IP secondario per i servizi. Puoi utilizzare un intervallo secondario esistente nella tua rete VPC o specificarne uno nuovo nella notazione CIDR.
Nella sezione IP privato, seleziona la casella di controllo Abilita IP privato.
Nella sezione IP privato master del cluster GKE, specifica un intervallo IP per il control plane GKE:
Per utilizzare l'intervallo IP predefinito per la regione in cui si trova il tuo ambiente, seleziona Intervallo IP predefinito.
Per specificare un intervallo IP personalizzato, seleziona Intervallo IP personalizzato e inserisci un intervallo nella notazione CIDR nel campo IP privato del master del cluster GKE.
Seleziona il livello di accesso per il control plane GKE. Il control plane ha due endpoint. Un endpoint è privato e viene utilizzato dai nodi e dalle VM del cluster. Un altro endpoint è pubblico. Puoi specificare il livello di accesso per l'endpoint pubblico:
Per abilitare l'accesso all'endpoint pubblico dalle reti autorizzate, seleziona la casella di controllo Accedi all'endpoint master utilizzando l'indirizzo IP esterno.
Se utilizzi questa opzione, il livello di accesso per il control plane viene impostato su "Accesso all'endpoint pubblico abilitato, reti autorizzate abilitate". In questo modo, l'accesso al control plane è limitato alle reti autorizzate. Per impostazione predefinita, non vengono specificati indirizzi IP di origine. Puoi aggiungere reti autorizzate al cluster.
Per disabilitare l'accesso all'endpoint pubblico dalle reti autorizzate, deseleziona la casella di controllo Accedi all'endpoint master utilizzando l'indirizzo IP esterno.
Se utilizzi questa opzione, il livello di accesso per il control plane viene impostato su "Accesso all'endpoint pubblico disabilitato". In questo modo, viene impedito l'accesso a internet al control plane.
Nella sezione IP privato server web, specifica un intervallo IP per l'istanza del server web Airflow.
Nella sezione IP privato Cloud SQL, specifica un intervallo IP per l'istanza Cloud SQL.
gcloud
Assicurati che la rete sia configurata per il tipo di ambiente che vuoi creare.
Quando crei un ambiente, i seguenti argomenti controllano i parametri di rete. Se ometti un parametro, viene utilizzato il valore predefinito.
--enable-private-environmentconsente un ambiente IP privato.--enable-ip-aliasabilita VPC nativo utilizzando indirizzi IP alias.Questo parametro è obbligatorio quando utilizzi
--enable-private-environmento quando configuri intervalli secondari per pod e servizi.--networkspecifica l'ID della tua rete VPC.--subnetworkspecifica l'ID subnet VPC.--cluster-secondary-range-nameo--cluster-ipv4-cidrconfigura l'intervallo secondario per i pod.--services-secondary-range-nameo--services-ipv4-cidrper configurare l'intervallo secondario per i servizi.--master-ipv4-cidrspecifica un intervallo per il control plane GKE.
--web-server-ipv4-cidrspecifica un intervallo per l'istanza del server web Airflow.--cloud-sql-ipv4-cidrspecifica un intervallo per l'istanza Cloud SQL.
--enable-private-endpointcontrolla il livello di accesso per il control plane GKE. Il control plane ha due endpoint. Un endpoint è privato e viene utilizzato dai nodi e dalle VM del cluster. Un altro endpoint è pubblico. Puoi specificare il livello di accesso per l'endpoint pubblico:Per abilitare l'accesso all'endpoint pubblico dalle reti autorizzate, ometti l'argomento
--enable-private-endpoint.Se utilizzi questa opzione, il livello di accesso per il control plane viene impostato su "Accesso all'endpoint pubblico abilitato, reti autorizzate abilitate". In questo modo, l'accesso al control plane è limitato alle reti autorizzate. Per impostazione predefinita, non vengono specificati indirizzi IP di origine. Puoi aggiungere reti autorizzate al cluster.
Per disattivare l'accesso all'endpoint pubblico dalle reti autorizzate, specifica l'argomento
--enable-private-endpoint.Se utilizzi questa opzione, il livello di accesso per il control plane viene impostato su "Accesso all'endpoint pubblico disabilitato". In questo modo, viene impedito l'accesso a internet al control plane.
Gli argomenti
--enable-master-authorized-networkse--master-authorized-networksconfigurano le reti autorizzate per il tuo ambiente.--enable-privately-used-public-ipsconfigura indirizzi IP pubblici utilizzati privatamente per il tuo ambiente.--enable-ip-masq-agentabilita l'agente di mascheramento IP.
Esempio (ambiente IP privato)
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "SERVICE_ACCOUNT" \
--enable-private-environment \
--enable-ip-alias \
--network NETWORK_ID \
--subnetwork SUBNETWORK_ID \
--cluster-ipv4-cidr PODS_RANGE \
--services-ipv4-cidr SERVICES_RANGE \
--master-ipv4-cidr CONTROL_PLANE_RANGE \
--web-server-ipv4-cidr WEB_SERVER_RANGE \
--cloud-sql-ipv4-cidr SQL_RANGE
Sostituisci:
NETWORK_IDcon l'ID rete VPC.SUBNETWORK_IDcon l'ID subnet VPC.PODS_RANGEcon l'intervallo secondario per i pod.SERVICES_RANGEcon l'intervallo secondario per i servizi.CONTROL_PLANE_RANGEcon l'intervallo secondario per il control plane GKE.WEB_SERVER_RANGEcon l'intervallo secondario per l'istanza del server web Airflow.SQL_RANGEcon l'intervallo per l'istanza Cloud SQL.
Passaggio 5: (Facoltativo) Aggiungere tag di rete
I tag di rete vengono applicati a tutte le VM dei nodi nel cluster dell'ambiente. I tag vengono utilizzati per identificare origini o destinazioni valide per i firewall di rete. Ogni tag all'interno dell'elenco deve essere conforme allo standard RFC 1035.
Ad esempio, potresti voler aggiungere tag di rete se prevedi di limitare il traffico per un ambiente IP privato con regole firewall.
Console
Nella pagina Crea ambiente:
- Individua la sezione Configurazione del nodo.
- Nel campo Tag, specifica i tag istanza per le VM dei nodi.
gcloud
Quando crei un ambiente, i seguenti argomenti controllano i tag di rete:
--tagsspecifica un elenco separato da virgole di tag di rete applicati a tutte le VM del nodo.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "SERVICE_ACCOUNT" \
--tags TAGS
Sostituisci:
TAGScon un elenco separato da virgole di tag di rete.
Esempio:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-1.20.12-airflow-1.10.15 \
--tags group1,production
API
Quando crei un ambiente, nella risorsa Environment > EnvironmentConfig, specifica i tag di rete per l'ambiente.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"nodeConfig": {
"tags": [
"TAG"
],
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
TAGcon un tag di rete.
Esempio:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"nodeConfig": {
"tags": [
"group1",
"production"
],
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Quando crei un ambiente, i seguenti campi definiscono i tag di rete per l'ambiente:
- Il campo
tagsnel blocconode_configspecifica un elenco separato da virgole di tag di rete applicati a tutte le VM del nodo.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
node_config {
tags = ["TAGS"]
service_account = "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
TAGScon un elenco separato da virgole di tag di rete.
Esempio:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
node_config {
tags = ["group1","production"]
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Passaggio 6: (Facoltativo) Configurare l'accesso di rete al server web
I parametri di accesso al server web Airflow non dipendono dal tipo di ambiente. Puoi invece configurare l'accesso al server web separatamente. Ad esempio, un ambiente IP privato può comunque avere l'interfaccia utente di Airflow accessibile da internet.
Non puoi configurare gli intervalli IP consentiti utilizzando indirizzi IP privati.
Console
Nella sezione Configurazione del server web della pagina Crea ambiente:
Per fornire l'accesso al server web Airflow da tutti gli indirizzi IP, seleziona Consenti l'accesso da tutti gli indirizzi IP.
Per limitare l'accesso solo a intervalli IP specifici, seleziona Consenti l'accesso solo da indirizzi IP specifici. Nel campo Intervallo IP, specifica un intervallo IP in notazione CIDR. Nel campo Descrizione, specifica una descrizione facoltativa per questo intervallo. Se vuoi specificare più di un intervallo, fai clic su Aggiungi intervallo IP.
Per vietare l'accesso a tutti gli indirizzi IP, seleziona Consenti l'accesso solo da indirizzi IP specifici e fai clic su Elimina elemento accanto alla voce intervallo vuoto.
gcloud
Quando crei un ambiente, i seguenti argomenti controllano il livello di accesso al server web:
--web-server-allow-allfornisce l'accesso ad Airflow da tutti gli indirizzi IP. Questa è l'opzione predefinita.--web-server-allow-iplimita l'accesso solo a intervalli IP di origine specifici. Per specificare più intervalli IP, utilizza questo argomento più volte.--web-server-deny-allvieta l'accesso per tutti gli indirizzi IP.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-1.20.12-airflow-1.10.15 \
--web-server-allow-ip ip_range=WS_IP_RANGE,description=WS_RANGE_DESCRIPTION
Sostituisci:
WS_IP_RANGEcon l'intervallo IP, nella notazione CIDR, che può accedere all'interfaccia utente di Airflow.WS_RANGE_DESCRIPTIONcon la descrizione dell'intervallo IP.
Esempio:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--web-server-allow-ip ip_range=192.0.2.0/24,description="office net 1" \
--web-server-allow-ip ip_range=192.0.4.0/24,description="office net 3"
API
Quando crei un ambiente, nella risorsa Environment > EnvironmentConfig, specifica i parametri di accesso al server web.
Per fornire l'accesso al server web Airflow da tutti gli indirizzi IP, ometti
webServerNetworkAccessControl.Per limitare l'accesso solo a intervalli IP specifici, specifica uno o più intervalli in
allowedIpRanges.Per vietare l'accesso a tutti gli indirizzi IP, aggiungi
allowedIpRangese crea un elenco vuoto. Non specificare intervalli IP.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"webServerNetworkAccessControl": {
"allowedIpRanges": [
{
"value": "WS_IP_RANGE",
"description": "WS_RANGE_DESCRIPTION"
}
]
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
WS_IP_RANGEcon l'intervallo IP, nella notazione CIDR, che può accedere all'interfaccia utente di Airflow.WS_RANGE_DESCRIPTIONcon la descrizione dell'intervallo IP.
Esempio:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"webServerNetworkAccessControl": {
"allowedIpRanges": [
{
"value": "192.0.2.0/24",
"description": "office net 1"
},
{
"value": "192.0.4.0/24",
"description": "office net 3"
}
]
},
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Quando crei un ambiente, il blocco allowed_ip_range nel blocco web_server_network_access_control contiene intervalli IP che possono accedere al server web.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
web_server_network_access_control {
allowed_ip_range {
value = "WS_IP_RANGE"
description = "WS_RANGE_DESCRIPTION"
}
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
WS_IP_RANGEcon l'intervallo IP, nella notazione CIDR, che può accedere all'interfaccia utente di Airflow.WS_RANGE_DESCRIPTIONcon la descrizione dell'intervallo IP.
Esempio:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
web_server_network_access_control {
allowed_ip_range {
value = "192.0.2.0/24"
description = "office net 1"
},
allowed_ip_range {
value = "192.0.4.0/24"
description = "office net 3"
}
}
node_config {
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
Passaggio 7. (Facoltativo) Specifica gli override della configurazione di Airflow e le variabili di ambiente
Puoi configurare gli override della configurazione di Airflow e le variabili di ambiente quando crei un ambiente. In alternativa, puoi farlo in un secondo momento, dopo aver creato l'ambiente.
Alcune opzioni di configurazione di Airflow sono bloccate e non puoi eseguirne l'override.
Per l'elenco delle opzioni di configurazione di Airflow disponibili, consulta Riferimento alla configurazione per Airflow 2 e Airflow 1.10.*.
Per specificare gli override della configurazione Airflow e le variabili di ambiente:
Console
Nella pagina Crea ambiente:
Espandi l'elemento Networking, override della configurazione di Airflow e funzionalità aggiuntive.
Nella sezione Variabili di ambiente, fai clic su Aggiungi variabile di ambiente.
Inserisci il Nome e il Valore della variabile di ambiente.
Nella sezione Override della configurazione Airflow, fai clic su Aggiungi override della configurazione Airflow.
Inserisci Sezione, Chiave e Valore per l'override dell'opzione di configurazione.
Ad esempio:
Sezione Chiave Valore webserverdag_orientationTB
gcloud
Quando crei un ambiente, i seguenti argomenti controllano le variabili di ambiente e gli override della configurazione di Airflow:
--env-variablesspecifica un elenco di variabili di ambiente separate da virgole.I nomi delle variabili possono contenere lettere maiuscole e minuscole, cifre e trattini bassi, ma non possono iniziare con una cifra.
--airflow-configsspecifica un elenco di chiavi e valori separati da virgole per gli override della configurazione di Airflow.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "SERVICE_ACCOUNT" \
--env-variables ENV_VARS \
--airflow-configs CONFIG_OVERRIDES
Sostituisci:
ENV_VARScon un elenco di coppieNAME=VALUEseparate da virgole per le variabili di ambiente.CONFIG_OVERRIDEScon un elenco separato da virgole di coppieSECTION-KEY=VALUEper gli override della configurazione. Separa il nome della sezione di configurazione con il simbolo-, seguito dal nome della chiave. Ad esempio:core-dags_are_paused_at_creation.
Esempio:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--env-variables SENDGRID_MAIL_FROM=user@example.com,SENDGRID_API_KEY=example-key \
--airflow-configs core-dags_are_paused_at_creation=True,webserver-dag_orientation=TB
API
Quando crei un ambiente, nella risorsa Environment > EnvironmentConfig, specifica le variabili di ambiente e gli override della configurazione di Airflow.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"softwareConfig": {
"airflowConfigOverrides": {
"SECTION-KEY": "OVERRIDE_VALUE"
},
"envVariables": {
"VAR_NAME": "VAR_VALUE",
}
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
SECTIONcon la sezione del file di configurazione in cui si trova l'opzione di configurazione di Airflow.KEYcon il nome dell'opzione di configurazione di Airflow.OVERRIDE_VALUEcon un valore dell'opzione di configurazione di Airflow.VAR_NAMEcon il nome della variabile di ambiente.VAR_VALUEcon il valore della variabile di ambiente.
Esempio:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"softwareConfig": {
"airflowConfigOverrides": {
"core-dags_are_paused_at_creation": "True",
"webserver-dag_orientation": "TB"
},
"envVariables": {
"SENDGRID_MAIL_FROM": "user@example.com",
"SENDGRID_API_KEY": "example-key"
}
},
"nodeConfig": {
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Terraform
Quando crei un ambiente, i seguenti blocchi controllano le variabili di ambiente e gli override della configurazione di Airflow:
Il blocco
env_variablesnel bloccosoftware_configspecifica le variabili di ambiente.I nomi delle variabili possono contenere lettere maiuscole e minuscole, cifre e trattini bassi, ma non possono iniziare con una cifra.
Il blocco
airflow_config_overridesnel bloccosoftware_configspecifica gli override della configurazione Airflow.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
software_config {
airflow_config_overrides = {
SECTION-KEY = "OVERRIDE_VALUE"
}
env_variables = {
VAR_NAME = "VAR_VALUE"
}
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
SECTIONcon la sezione del file di configurazione in cui si trova l'opzione di configurazione di Airflow.KEYcon il nome dell'opzione di configurazione di Airflow.OVERRIDE_VALUEcon un valore dell'opzione di configurazione di Airflow.VAR_NAMEcon il nome della variabile di ambiente.VAR_VALUEcon il valore della variabile di ambiente.
Esempio:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
software_config {
airflow_config_overrides = {
core-dags_are_paused_at_creation = "True"
webserver-dag_orientation = "TB"
}
env_variables = {
SENDGRID_MAIL_FROM = "user@example.com"
SENDGRID_API_KEY = "example-key"
}
}
node_config {
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
}
}
Passaggio 8. (Facoltativo) Specifica i periodi di manutenzione
Per impostazione predefinita, gli ambienti Cloud Composer 1 non hanno finestre di manutenzione definite se li crei utilizzando la consoleGoogle Cloud , l'API o Terraform. Ti consigliamo di specificare periodi di manutenzione per gli ambienti nuovi ed esistenti.
Se crei l'ambiente utilizzando gcloud CLI, l'ambiente ha periodi di manutenzione predefiniti dalle 00:00:00 alle 04:00:00 (GMT) di venerdì, sabato e domenica di ogni settimana.
Per specificare periodi di manutenzione personalizzati per il tuo ambiente:
Console
Nella pagina Crea ambiente:
Espandi l'elemento Networking, override della configurazione di Airflow e funzionalità aggiuntive.
Nella sezione Periodi di manutenzione, seleziona la casella di controllo Imposta un orario personalizzato per i periodi di manutenzione.
Nell'elenco a discesa Fuso orario, scegli un fuso orario per le finestre di manutenzione.
Imposta Ora di inizio, Giorni e Durata in modo che il tempo combinato per la pianificazione specificata sia di almeno 12 ore in una finestra mobile di 7 giorni. Ad esempio, un periodo di 4 ore ogni lunedì, mercoledì e venerdì fornisce la quantità di tempo richiesta.
gcloud
I seguenti argomenti definiscono i parametri dei periodi di manutenzione:
--maintenance-window-startimposta l'ora di inizio di un periodo di manutenzione.--maintenance-window-endimposta l'ora di fine di un periodo di manutenzione.--maintenance-window-recurrenceimposta la ricorrenza del periodo di manutenzione.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "SERVICE_ACCOUNT" \
--maintenance-window-start 'DATETIME_START' \
--maintenance-window-end 'DATETIME_END' \
--maintenance-window-recurrence 'MAINTENANCE_RECURRENCE'
Sostituisci:
ENVIRONMENT_NAMEcon il nome dell'ambiente.DATETIME_STARTcon la data e l'ora di inizio nel formato di input data/ora. Viene utilizzata solo l'ora specificata del giorno, la data specificata viene ignorata.DATETIME_ENDcon la data e l'ora di fine nel formato di input di data/ora. Viene utilizzata solo l'ora specificata del giorno, la data specificata viene ignorata. La data e l'ora specificate devono essere successive alla data di inizio.MAINTENANCE_RECURRENCEcon una RRULE RFC 5545 per la ricorrenza dei periodi di manutenzione. Cloud Composer supporta due formati:Il formato
FREQ=DAILYspecifica una ricorrenza giornaliera.Il formato
FREQ=WEEKLY;BYDAY=SU,MO,TU,WE,TH,FR,SAspecifica una ricorrenza nei giorni della settimana selezionati.
L'esempio seguente specifica un periodo di manutenzione di 6 ore tra le 01:00 e le 07:00 (UTC) di mercoledì, sabato e domenica. La data del 1° gennaio 2023 viene ignorata.
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--maintenance-window-start '2023-01-01T01:00:00Z' \
--maintenance-window-end '2023-01-01T07:00:00Z' \
--maintenance-window-recurrence 'FREQ=WEEKLY;BYDAY=SU,WE,SA'
API
Quando crei un ambiente, nella risorsa Environment > EnvironmentConfig, specifica i parametri delle finestre di manutenzione:
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"maintenanceWindow": {
"startTime": "DATETIME_START",
"endTime": "DATETIME_END",
"recurrence": "MAINTENANCE_RECURRENCE"
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
DATETIME_STARTcon la data e l'ora di inizio nel formato di input data/ora. Viene utilizzata solo l'ora del giorno specificata, la data specificata viene ignorata.DATETIME_ENDcon la data e l'ora di fine nel formato di input di data/ora. Viene utilizzata solo l'ora del giorno specificata, la data specificata viene ignorata. La data e l'ora specificate devono essere successive alla data di inizio.MAINTENANCE_RECURRENCEcon una RRULE RFC 5545 per la ricorrenza dei periodi di manutenzione. Cloud Composer supporta due formati:Il formato
FREQ=DAILYspecifica una ricorrenza giornaliera.Il formato
FREQ=WEEKLY;BYDAY=SU,MO,TU,WE,TH,FR,SAspecifica una ricorrenza nei giorni della settimana selezionati.
L'esempio seguente specifica un periodo di manutenzione di 6 ore tra le 01:00 e le 07:00 (UTC) di mercoledì, sabato e domenica. La data del 1° gennaio 2023 viene ignorata.
Esempio:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"maintenanceWindow": {
"startTime": "2023-01-01T01:00:00Z",
"endTime": "2023-01-01T07:00:00Z",
"recurrence": "FREQ=WEEKLY;BYDAY=SU,WE,SA"
},
"nodeConfig": {
"serviceAccount": "SERVICE_ACCOUNT"
}
}
}
Terraform
Il blocco maintenance_window specifica i periodi di manutenzione per il tuo
ambiente:
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
maintenance_window {
start_time = "DATETIME_START"
end_time = "DATETIME_END"
recurrence = "MAINTENANCE_RECURRENCE"
}
node_config {
service_account = "SERVICE_ACCOUNT"
}
}
}
Sostituisci:
DATETIME_STARTcon la data e l'ora di inizio nel formato di input data/ora. Viene utilizzata solo l'ora del giorno specificata, la data specificata viene ignorata.DATETIME_ENDcon la data e l'ora di fine nel formato di input di data/ora. Viene utilizzata solo l'ora del giorno specificata, la data specificata viene ignorata. La data e l'ora specificate devono essere successive alla data di inizio.MAINTENANCE_RECURRENCEcon una RRULE RFC 5545 per la ricorrenza dei periodi di manutenzione. Cloud Composer supporta due formati:- Il formato
FREQ=DAILYspecifica una ricorrenza giornaliera. - Il formato
FREQ=WEEKLY;BYDAY=SU,MO,TU,WE,TH,FR,SAspecifica una ricorrenza nei giorni della settimana selezionati.
- Il formato
L'esempio seguente specifica un periodo di manutenzione di 6 ore tra le 01:00 e le 07:00 (UTC) di mercoledì, sabato e domenica. La data del 1° gennaio 2023 viene ignorata.
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
maintenance_window {
start_time = "2023-01-01T01:00:00Z"
end_time = "2023-01-01T07:00:00Z"
recurrence = "FREQ=WEEKLY;BYDAY=SU,WE,SA"
}
}
}
Passaggio 9: (Facoltativo) Configura la crittografia dei dati (CMEK)
Per impostazione predefinita, i dati nel tuo ambiente sono criptati con una chiave fornita da Google.
Per utilizzare le chiavi di crittografia gestite dal cliente (CMEK) per criptare i dati nel tuo ambiente, segui le istruzioni descritte in Utilizzo delle chiavi di crittografia gestite dal cliente.
Passaggio 10: (Facoltativo) Specifica le etichette dell'ambiente
Puoi assegnare etichette ai tuoi ambienti per suddividere i costi di fatturazione in base a queste etichette.
Console
Nella pagina Crea ambiente:
Espandi l'elemento Networking, override della configurazione di Airflow e funzionalità aggiuntive.
Nella sezione Etichette, fai clic su Aggiungi etichetta.
Nei campi Chiave e Valore, specifica le coppie chiave-valore per le etichette dell'ambiente.
gcloud
Quando crei un ambiente, l'argomento --labels specifica un elenco separato da virgole di chiavi e valori con etichette dell'ambiente.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "SERVICE_ACCOUNT" \
--labels LABELS
Sostituisci:
LABELScon un elenco di coppieKEY=VALUEseparate da virgole per le etichette dell'ambiente.
Esempio:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--labels owner=engineering-team,env=production
API
Quando crei un ambiente, nella risorsa Environment, specifica le etichette per l'ambiente.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"labels": {
"LABEL_KEY": "LABEL_VALUE"
}
}
Sostituisci:
LABEL_KEYcon una chiave dell'etichetta dell'ambiente.LABEL_VALUEcon un valore dell'etichetta dell'ambiente.
Esempio:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"labels": {
"owner": "engineering-team",
"env": "production"
}
}
Terraform
Quando crei un ambiente, specifica le etichette nel blocco labels (al di fuori del blocco config).
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
labels = {
LABEL_KEY = "LABEL_VALUE"
}
}
Sostituisci:
LABEL_KEYcon una chiave dell'etichetta dell'ambiente.LABEL_VALUEcon un valore dell'etichetta dell'ambiente.
Esempio:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
labels = {
owner = "engineering-team"
env = "production"
}
}
Passaggio 11. (Facoltativo) Configurare altri parametri
Altri parametri includono:
Zona per i nodi dell'ambiente
Zona di Compute Engine in cui eseguire il deployment dei nodi cluster. In questo parametro, puoi selezionare una zona specifica nella località del tuo ambiente.
Per impostazione predefinita, viene selezionata automaticamente una zona casuale.
ambiti OAuth
Gli ambiti OAuth sono un insieme di ambiti delle API di Google da rendere disponibili su tutte le VM del nodo. Se è vuoto, il valore predefinito è
https://www.googleapis.com/auth/cloud-platform.Se specifichi ambiti OAuth personalizzati, includi
https://www.googleapis.com/auth/cloud-platformnell'elenco degli ambiti specificati.Versione Python
Se il tuo ambiente utilizza Airflow 1.10.* e versioni precedenti di Airflow, puoi far sì che il tuo ambiente utilizzi Python 2. La versione Python predefinita è Python 3. Per ulteriori informazioni sul supporto di Python 2 in Cloud Composer, vedi Versioni di Python supportate.
Console
Nella pagina Crea ambiente:
Nella sezione Configurazione del nodo:
Nell'elenco a discesa Zona, seleziona una zona per i nodi dell'ambiente.
Non puoi modificare la zona in un secondo momento.
Nel campo Ambiti OAuth, specifica gli ambiti OAuth per le VM dei nodi.
Non puoi modificare gli ambiti OAuth in un secondo momento.
Per specificare più ambiti OAuth, fornisci un elenco di valori separati da virgole. Includi
https://www.googleapis.com/auth/cloud-platformnell'elenco degli ambiti specificati.Nel campo Versione Python, scegli la versione di Python.
Non potrai modificare la versione di Python in un secondo momento.
gcloud
Quando crei un ambiente, i seguenti argomenti controllano vari parametri dell'ambiente:
--zonespecifica una zona Compute Engine per le VM del tuo ambiente.--oauth-scopesspecifica un elenco di ambiti OAuth separati da virgole. Includihttps://www.googleapis.com/auth/cloud-platformnell'elenco degli ambiti specificati.--python-versionspecifica la versione di Python.
gcloud composer environments create ENVIRONMENT_NAME \
--location LOCATION \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "SERVICE_ACCOUNT" \
--zone ZONE \
--oauth-scopes OAUTH_SCOPES \
--python-version PYTHON_VERSION
Sostituisci:
ZONEcon il nome della zona di Compute Engine.OAUTH_SCOPEScon un elenco separato da virgole di ambiti OAuth.PYTHON_VERSIONcon la versione di Python (3o2).
Esempio:
gcloud composer environments create example-environment \
--location us-central1 \
--image-version composer-1.20.12-airflow-1.10.15 \
--service-account "
example-account@example-project.iam.gserviceaccount.com
" \
--zone us-central1-a \
--oauth-scopes https://www.googleapis.com/auth/cloud-platform,https://www.googleapis.com/auth/bigquery \
--python-version 3
API
Quando crei un ambiente, nella risorsa Environment > EnvironmentConfig, specifica i parametri vari dell'ambiente.
{
"name": "projects/PROJECT_ID/locations/LOCATION/environments/ENVIRONMENT_NAME",
"config": {
"nodeConfig": {
"location": "projects/PROJECT_ID/zones/ZONE",
"oauthScopes": [
"OAUTH_SCOPE"
],
"serviceAccount": "SERVICE_ACCOUNT"
},
"softwareConfig": {
"pythonVersion": "PYTHON_VERSION"
}
}
}
Sostituisci:
ZONEcon il nome della zona di Compute Engine.OAUTH_SCOPEcon un ambito OAuth. Per specificare ambiti aggiuntivi, aggiungi l'ambitohttps://www.googleapis.com/auth/cloud-platform, seguito dagli elementi dell'ambito aggiuntivo. ambiti.PYTHON_VERSIONcon la versione di Python (3o2).
Esempio:
// POST https://composer.googleapis.com/v1/{parent=projects/*/locations/*}/environments
{
"name": "projects/example-project/locations/us-central1/environments/example-environment",
"config": {
"nodeConfig": {
"location": "projects/example-project/zones/us-central1-a",
"oauthScopes": [
"https://www.googleapis.com/auth/cloud-platform",
"https://www.googleapis.com/auth/bigquery"
],
"serviceAccount": "
example-account@example-project.iam.gserviceaccount.com
"
},
"softwareConfig": {
"pythonVersion": "3"
}
}
}
Terraform
Quando crei un ambiente, i seguenti campi controllano vari parametri dell'ambiente:
Il campo
zonenel blocconode_configspecifica una zona di Compute Engine per le VM dell'ambiente.Il campo
oauth_scopesnel blocconode_configspecifica un elenco separato da virgole di ambiti OAuth.Il campo
python_versionnel bloccosoftware_configspecifica la versione di Python.
resource "google_composer_environment" "example" {
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
node_config {
zone = "ZONE"
oauth_scopes = "[OAUTH_SCOPES]"
service_account = "SERVICE_ACCOUNT"
}
software_config {
python_version = "PYTHON_VERSION"
}
}
}
Sostituisci:
ZONEcon il nome della zona di Compute Engine.OAUTH_SCOPEScon un elenco separato da virgole di ambiti OAuth.PYTHON_VERSIONcon la versione di Python (3o2).
Esempio:
resource "google_composer_environment" "example" {
name = "example-environment"
region = "us-central1"
config {
node_config {
zone = "us-central1-a"
oauth_scopes = "[https://www.googleapis.com/auth/cloud-platform,https://www.googleapis.com/auth/bigquery]"
service_account = "
example-account@example-project.iam.gserviceaccount.com
"
}
software_config {
python_version = "3"
}
}
}
Passaggio 12. (Facoltativo) Applica l'utilizzo dell'API beta
Puoi fare in modo esplicito che il tuo ambiente utilizzi l'API Cloud Composer beta, anche se l'ambiente non dispone di funzionalità di anteprima. In questo caso, l'ambiente viene creato utilizzando l'endpoint del servizio v1beta1.
Console
Nella pagina Crea ambiente:
Espandi l'elemento Networking, override della configurazione di Airflow e funzionalità aggiuntive.
Nella sezione API beta, seleziona la casella di controllo Applica l'uso dell'API beta.
gcloud
Crea l'ambiente utilizzando
il comando gcloud beta composer.
API
Crea l'ambiente utilizzando l'endpoint del servizio v1beta1.
Terraform
Il provider Terraform per Cloud Composer utilizza l'API beta per impostazione predefinita.
Passaggi successivi
- Risoluzione dei problemi di creazione dell'ambiente
- Configurazione del VPC condiviso
- Configurazione dei Controlli di servizio VPC
- Aggiunta e aggiornamento di DAG
- Accedere alla UI di Airflow
- Aggiornamento ed eliminazione di ambienti
- Informazioni sulle versioni di Cloud Composer