Ao contrário dos fluxos de trabalho padrão que instanciam um recurso de modelo de fluxo de trabalho criado anteriormente, os fluxos de trabalho inline usam um arquivo YAML ou uma definição WorkflowTemplate incorporada para executar um fluxo de trabalho.
.Criar e executar um fluxo de trabalho in-line
gcloud
Consulte Instanciar um fluxo de trabalho usando um arquivo YAML.
REST
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- project-id: Google Cloud ID do projeto
- region: região do cluster, como "us-central1"
- zoneUri: especifique uma zone na região do cluster , como "us-central1-b", ou deixe em branco ("") para usar Serviço gerenciado para Apache Spark Canal da zona automática
- clusterName: nome do cluster
Método HTTP e URL:
POST https://dataproc.googleapis.com/v1/projects/project-id/regions/region/workflowTemplates:instantiateInline
Corpo JSON da solicitação:
{
"jobs": [
{
"hadoopJob": {
"mainJarFileUri": "file:///usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar",
"args": [
"teragen",
"1000",
"hdfs:///gen/"
]
},
"stepId": "teragen"
},
{
"hadoopJob": {
"mainJarFileUri": "file:///usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar",
"args": [
"terasort",
"hdfs:///gen/",
"hdfs:///sort/"
]
},
"stepId": "terasort",
"prerequisiteStepIds": [
"teragen"
]
}
],
"placement": {
"managedCluster": {
"clusterName": "cluster-name",
"config": {
"gceClusterConfig": {
"zoneUri": "zone"
}
}
}
}
}
Para enviar a solicitação, expanda uma destas opções:
Você receberá uma resposta JSON semelhante a esta:
{
"name": "projects/project-id/regions/region/operations/2fbd0dad-...",
"metadata": {
"@type": "type.googleapis.com/google.cloud.dataproc.v1.WorkflowMetadata",
"graph": {
"nodes": [
{
"stepId": "teragen",
"state": "RUNNABLE"
},
{
"stepId": "terasort",
"prerequisiteStepIds": [
"teragen"
],
"state": "BLOCKED"
}
]
},
"state": "PENDING",
"startTime": "2020-04-02T22:50:44.826Z"
}
}
Console
No momento, a criação de fluxos de trabalho inline não é compatível no o Google Cloud console. Os modelos de fluxo de trabalho e os fluxos de trabalho instanciados podem ser visualizados na página do Serviço gerenciado para Apache Spark Fluxos de trabalho.