Puoi applicare etichette utente ai cluster e ai job Dataproc per raggruppare queste risorse per il filtraggio e l'elenco successivi. Le etichette vengono associate alle risorse al momento della creazione della risorsa, della creazione del cluster o dell'invio del job. Una volta che una risorsa è associata a un'etichetta, l'etichetta viene propagata alle operazioni eseguite su la risorsa (creazione, aggiornamento, applicazione di patch o eliminazione del cluster; invio, aggiornamento, annullamento o eliminazione del job), consentendoti di filtrare ed elencare cluster, job e operazioni in base all'etichetta.
Puoi anche aggiungere etichette alle risorse di Compute Engine associate alle risorse del cluster, come le istanze di macchine virtuali e i dischi.
Cosa sono le etichette?
Un'etichetta è una coppia chiave-valore che puoi assegnare ai cluster e ai job Dataproc. Ti aiutano a organizzare queste risorse e a gestire i costi su larga scala, con la granularità di cui hai bisogno. Puoi collegare un'etichetta a ogni risorsa, quindi filtrare le risorse in base alle relative etichette. Le informazioni relative alle etichette vengono inoltrate al sistema di fatturazione, che ti consente di suddividere i costi fatturati in base all'etichetta. Con i report di fatturazione integrati, puoi filtrare e raggruppare i costi in base alle etichette delle risorse. Puoi anche utilizzare le etichette per eseguire query sulle esportazioni dei dati di fatturazione.
Requisiti per le etichette
Le etichette applicate a una risorsa devono soddisfare i seguenti requisiti:
- Ogni cluster o job può avere fino a 32 etichette.
- Ogni etichetta deve essere una coppia chiave-valore.
- Le chiavi hanno una lunghezza minima di 1 carattere e una lunghezza massima di 63 caratteri e non possono essere vuote. I valori possono essere vuoti e avere una lunghezza massima di 63 caratteri.
- Chiavi e valori possono contenere solo lettere minuscole, caratteri numerici, trattini bassi e trattini. Tutti i caratteri devono utilizzare la codifica UTF-8; sono consentiti i caratteri internazionali. Le chiavi devono iniziare con una lettera minuscola o carattere internazionale.
- La parte della chiave di un'etichetta deve essere univoca all'interno di una singola risorsa. Tuttavia, puoi utilizzare la stessa chiave con più risorse.
Questi limiti si applicano alla chiave e al valore di ogni etichetta e al singolo cluster o job Dataproc che hanno etichette. Non esiste alcun limite al numero di etichette che puoi applicare a tutte le risorse di un progetto.
Utilizzi comuni delle etichette
Ecco alcuni casi d'uso comuni per le etichette:
Etichette di team o centro di costo: aggiungi etichette basate su team o centro di costo per distinguere i cluster e i job Dataproc di proprietà di team diversi (ad esempio,
team:researcheteam:analytics). Puoi utilizzare questo tipo di etichetta per la contabilità dei costi o la definizione del budget.Etichette dei componenti: ad esempio,
component:redis,component:frontend,component:ingest, ecomponent:dashboard.Etichette di ambiente o fase: ad esempio,
environment:productioneenvironment:test.Etichette di stato: ad esempio,
state:active,state:readytodeleteestate:archive.Etichette di proprietà: utilizzate per identificare i team responsabili delle operazioni, ad esempio:
team:shopping-cart.
Non consigliamo di creare un numero elevato di etichette univoche, ad esempio per timestamp o valori individuali per ogni chiamata API. Il problema di questo approccio è che, quando i valori cambiano di frequente o con chiavi che ingombrano il catalogo, è difficile filtrare e generare report sulle risorse in modo efficace.
Etichette e tag
Le etichette possono essere utilizzate come annotazioni su cui è possibile eseguire query per le risorse, ma non possono essere utilizzate per impostare condizioni sulle policy. I tag forniscono un modo per consentire o negare in modo condizionale le policy a seconda che una risorsa abbia un tag specifico, fornendo un controllo granulare sulle policy. Per saperne di più, consulta la panoramica dei tag.
Creare e utilizzare le etichette Dataproc
Comando g-cloud
Puoi specificare una o più etichette da applicare a un cluster o a un job Dataproc al momento della creazione o dell'invio utilizzando Google Cloud CLI.
gcloud dataproc clusters create args --labels environment=production,customer=acmegcloud dataproc jobs submit args --labels environment=production,customer=acme
Una volta creato un cluster o un job Dataproc, puoi aggiornare le etichette associate a quella risorsa utilizzando Google Cloud CLI.
gcloud dataproc clusters update args --update-labels environment=production,customer=acmegcloud dataproc jobs update args --update-labels environment=production,customer=acme
Allo stesso modo, puoi utilizzare Google Cloud CLI per filtrare le risorse Dataproc in base all'etichetta utilizzando
un'espressione di filtro nel seguente formato: labels.<key=value>.
gcloud dataproc clusters list \ --region=region \ --filter="status.state=ACTIVE AND labels.environment=production"gcloud dataproc jobs list \ --region=region \ --filter="status.state=ACTIVE AND labels.customer=acme"
Per ulteriori informazioni sulla scrittura di un'espressione di filtro, consulta la documentazione dell'API Dataproc clusters.list e jobs.list.
API REST
Le etichette possono essere collegate ai cluster o ai job Dataproc tramite l'
API REST Dataproc. Le API clusters.create,
jobs.submit
possono essere utilizzate per collegare le etichette a un cluster o a un job al momento della creazione o dell'invio.
Le API clusters.patch,
jobs.patch
possono essere utilizzate per modificare le etichette dopo la creazione di un cluster. Di seguito è riportato il corpo JSON di una richiesta cluster.create che include l'etichetta
key1:value al cluster.
{
"clusterName":"cluster-1",
"projectId":"my-project",
"config":{
"configBucket":"",
"gceClusterConfig":{
"networkUri":".../networks/default",
"zoneUri":".../zones/us-central1-f"
},
"masterConfig":{
"numInstances":1,
"machineTypeUri":"..../machineTypes/n1-standard-4",
"diskConfig":{
"bootDiskSizeGb":500,
"numLocalSsds":0
}
},
"workerConfig":{
"numInstances":2,
"machineTypeUri":"...machineTypes/n1-standard-4",
"diskConfig":{
"bootDiskSizeGb":500,
"numLocalSsds":0
}
}
},
"labels":{
"key1":"value1"
}
}
Le API clusters.list
e jobs.list
possono essere utilizzate per elencare i cluster o i job che corrispondono a un filtro specificato, utilizzando
il seguente formato: labels.<key=value>.
Di seguito è riportata una richiesta HTTPS GET
clusters.list
dell'API Dataproc di esempio che specifica un filtro di etichette key=value. Il chiamante inserisce
project, region, un filtro label-key e label-value, e una api-key.
Tieni presente che questa richiesta di esempio è suddivisa in due righe per facilitarne la lettura.
GET https://dataproc.googleapis.com/v1/projects/project/regions/region/clusters? filter=labels.label-key=label-value&key=api-key
Per ulteriori informazioni sulla scrittura di un'espressione di filtro, consulta la documentazione dell'API Dataproc clusters.list e jobs.list.
Console
Puoi specificare un insieme di etichette da aggiungere a un cluster o a un job Dataproc al momento della creazione o dell'invio utilizzando la Google Cloud console.
- Aggiungi etichette a un cluster dalla sezione Etichette del riquadro Personalizza cluster della pagina Crea un cluster di Dataproc.
- Aggiungi etichette a un job dalla pagina Invia un job di Dataproc.
Una volta creato o inviato un cluster o un job Dataproc,
puoi aggiornare le etichette associate al cluster o al job. Per aggiornare le etichette,
fai clic sulla casella di selezione di un cluster o di un job elencato, quindi fai clic su SHOW INFO PANEL. Questo è un esempio della pagina Dataproc→Elenca cluster.

Una volta visualizzato il riquadro delle informazioni, puoi aggiornare le etichette per il tuo cluster o job Dataproc. Di seguito è riportato un esempio di aggiornamento delle etichette per un cluster Dataproc.

È anche possibile aggiornare le etichette per più elementi in un'unica operazione. In questo esempio, le etichette vengono aggiornate contemporaneamente per più job Dataproc.

Le etichette ti consentono di filtrare le risorse Dataproc mostrate nelle pagine [Dataproc→Elenca cluster](https://console.cloud.google.com/dataproc/clusters) e [Dataproc→Elenca job](https://console.cloud.google.com/dataproc/jobs). Nella parte superiore della pagina, puoi utilizzare il pattern di ricerca `labels.

Etichette applicate automaticamente
Quando crei o aggiorni un cluster, Dataproc automaticamente
applica diverse etichette al cluster e alle risorse del cluster. Ad esempio,
Dataproc applica le etichette a macchine virtuali, dischi permanenti,
e acceleratori quando viene creato un cluster. Le etichette applicate automaticamente hanno un
prefisso goog-dataproc speciale.
Le seguenti goog-dataproc etichette vengono applicate automaticamente alle
risorse Dataproc. I valori forniti per le etichette riservate
goog-dataproc `goog-dataproc` al momento della creazione del cluster sostituiranno
i valori forniti automaticamente. Per questo motivo, non è consigliabile fornire valori personalizzati per
queste etichette.
| Etichetta | Descrizione |
|---|---|
goog-dataproc-cluster-name |
Nome del cluster specificato dall'utente |
goog-dataproc-cluster-uuid |
ID cluster univoco |
goog-dataproc-location |
Endpoint del cluster regionale Dataproc |
Puoi utilizzare queste etichette applicate automaticamente in molti modi, tra cui:
- Cercare e filtrare le risorse Dataproc
- Filtrare i dati di fatturazione per calcolare i costi di Dataproc
Passaggi successivi
Scopri come creare e aggiornare le etichette per i progetti utilizzando Resource Manager.
Scopri come organizzare le risorse utilizzando le etichette.