O recurso de ajuste direito usa dicas de recursos do Apache Beam para personalizar recursos de worker para um pipeline. A capacidade de direcionar vários recursos diferentes para etapas específicas do pipeline oferece mais flexibilidade e capacidade, além de possível economia de custos. É possível aplicar recursos mais caros às etapas do pipeline que os exigem e recursos menos caros a outras etapas do pipeline. Use o ajuste direito para especificar os requisitos de recursos para um pipeline inteiro ou para etapas específicas de pipeline.
Suporte e limitações
- As dicas de recursos são compatíveis com os SDKs do Apache Beam para Java e Python, versões 2.31.0 e posteriores.
- O ajuste direito só é compatível com pipelines em lote.
O ajuste correto é compatível com pipelines de streaming com o escalonamento automático horizontal ativado.
- Para ativar, defina a opção de pipeline
--experiments=enable_streaming_rightfitting.
- Para ativar, defina a opção de pipeline
O ajuste direito é compatível com o Dataflow Prime.
O ajuste direito não é compatível com o FlexRS.
Quando você usar o ajuste direito, não use a opção de serviço
worker_accelerator.
Ativar ajuste direito
Para ativar o ajuste direito, use uma ou mais dicas de recursos disponíveis no pipeline. Quando você usa uma dica de recurso no pipeline, o ajuste correto é ativado automaticamente. Para mais informações, consulte a seção Usar dicas de recursos deste documento.
Dicas de recursos disponíveis
As seguintes dicas de recurso estão disponíveis:
| Dica de recurso | Descrição |
|---|---|
min_ram |
A quantidade mínima de RAM em gigabytes para alocar aos workers. O Dataflow usa esse valor como um limite inferior ao alocar memória para novos workers (escalonamento horizontal) ou para workers existentes (escalonamento vertical). Por exemplo: min_ram=NUMBERGB
|
accelerator |
Uma alocação de GPUs fornecida pelo usuário que permite controlar o uso e o custo de GPUs no pipeline e nas etapas dele. Especifique o tipo e o número de GPUs a serem anexadas aos workers do Dataflow como parâmetros à sinalização. Por exemplo: accelerator="type:GPU_TYPE;count:GPU_COUNT;machine_type:MACHINE_TYPE;CONFIGURATION_OPTIONS"
Para mais informações sobre o uso de GPUs, consulte GPUs com Dataflow. |
Aninhamento de dica de recurso
As dicas de recurso são aplicadas à hierarquia de transformação do pipeline da seguinte maneira:
min_ram: o valor em uma transformação é avaliado como o maior valor de dicamin_ramentre os valores definidos na própria transformação e todos os pais na hierarquia da transformação.- Exemplo: se uma dica de transformação interna definir
min_ramcomo 16 GB, e a dica de transformação externa nos conjuntos de hierarquiamin_ramcomo 32 GB, uma dica de 32 GB será usada em todas as etapas da transformação. - Exemplo: se uma dica de transformação interna definir
min_ramcomo 16 GB, e a dica de transformação externa nos conjuntos de hierarquiamin_ramcomo 8 GB, uma dica de 8 GB é usada para todas as etapas na transformação externa que não estão na transformação interna, e uma dica de 16 GB será usada em todas as etapas da transformação interna.
- Exemplo: se uma dica de transformação interna definir
accelerator: o valor mais interno na hierarquia da transformação tem precedência.- Exemplo: se uma dica
acceleratorde transformação interna for diferente de uma dicaacceleratorde transformação externa em uma hierarquia, a dicaacceleratorde transformação interna será usada para a transformação interna.
- Exemplo: se uma dica
As dicas definidas para todo o pipeline são tratadas como se fossem definidas em uma transformação externa separada.
Use dicas de recursos
É possível definir dicas de recursos em todo o pipeline ou nas etapas de pipeline.
Dicas de recursos do pipeline
É possível definir dicas de recursos em todo o pipeline quando você o executar na linha de comando.
Para configurar o ambiente do Python, consulte o tutorial do Python.
Exemplo:
python my_pipeline.py \
--runner=DataflowRunner \
--resource_hints=min_ram=numberGB \
--resource_hints=accelerator="type:type;count:number;install-nvidia-driver" \
...
Dicas de recursos da etapa do pipeline
É possível definir dicas de recursos em etapas (transformações) do pipeline de forma programática.
Java
Para instalar o SDK do Apache Beam para Java, consulte Instalar o SDK do Apache Beam.
É possível definir dicas de recursos de maneira programática em transformações de pipeline usando a
classe ResourceHints.
Veja no exemplo a seguir como definir dicas de recursos de maneira programática nas transformações de pipeline.
pcoll.apply(MyCompositeTransform.of(...)
.setResourceHints(
ResourceHints.create()
.withMinRam("15GB")
.withAccelerator(
"type:nvidia-l4;count:1;install-nvidia-driver")))
pcoll.apply(ParDo.of(new BigMemFn())
.setResourceHints(
ResourceHints.create().withMinRam("30GB")))
Para definir dicas de recursos de maneira programática em todo o pipeline, use a
interface ResourceHintsOptions.
Python
Para instalar o SDK do Apache Beam para Python, consulte Instalar o SDK do Apache Beam.
É possível definir dicas de recursos de maneira programática em transformações de pipeline usando a
classe PTransforms.with_resource_hints.
Para saber mais, consulte a
classe ResourceHint.
Veja no exemplo a seguir como definir dicas de recursos de maneira programática nas transformações de pipeline.
pcoll | MyPTransform().with_resource_hints(
min_ram="4GB",
accelerator="type:nvidia-tesla-l4;count:1;install-nvidia-driver")
pcoll | beam.ParDo(BigMemFn()).with_resource_hints(
min_ram="30GB")
Para definir dicas de recursos em todo o pipeline, use a opção de pipeline --resource_hints
ao executar o pipeline. Para ver um exemplo, consulte
Dicas de recurso de pipeline.
Go
As dicas de recursos não são compatíveis com o Go.
Suporte para vários aceleradores
Em um pipeline, transformações diferentes podem ter configurações de acelerador diferentes. Isso inclui configurações que exigem diferentes tipos de máquinas. Essas configurações de acelerador no nível da transformação têm precedência sobre a configuração no nível do pipeline, se uma tiver sido fornecida.
Ajuste direito e fusão
Em alguns casos, transformações definidas com diferentes dicas de recursos podem ser executadas em workers no mesmo pool de workers, como parte do processo de otimização de fusão. Quando as transformações são unidas, o Dataflow as executa em um ambiente que atende à união de dicas de recursos definidas nas transformações. Em alguns casos, isso inclui todo o pipeline.
Quando as dicas de recursos não podem ser mescladas, a fusão não ocorre. Por exemplo, as dicas de recursos para GPUs diferentes não podem ser mescladas. Portanto, essas transformações não são fundidas.
Para evitar a fusão, adicione uma operação ao pipeline que force
o Dataflow a materializar um PCollection intermediário. Isso é especialmente útil ao tentar isolar recursos caros, como GPUs ou máquinas de alta memória, de etapas lentas ou computacionalmente caras que não precisam desses recursos especiais. Nesses casos, pode ser útil forçar uma interrupção de fusão entre as etapas lentas vinculadas à CPU e as etapas que precisam de GPUs caras ou máquinas com alta memória e pagar o custo de materialização associado à interrupção da fusão. Para saber mais, consulte
Evitar a fusão.
Ajuste direito de streaming
Para jobs de streaming, é possível ativar o ajuste à direita definindo a opção de pipeline --experiments=enable_streaming_rightfitting.
O ajuste adequado pode melhorar a performance do seu pipeline se ele envolver etapas com diferentes requisitos de recursos.
Exemplo: pipeline com uma etapa que exige muita CPU e outra que exige GPU
Um exemplo de pipeline que pode se beneficiar do ajuste correto é aquele que executa uma etapa com uso intenso da CPU, seguida por uma etapa que exige GPU. Sem o ajuste correto, um único pool de workers de GPU precisará ser configurado para executar todas as etapas do pipeline, incluindo a etapa com uso intensivo de CPU. Isso pode levar à subutilização dos recursos da GPU quando o pool de workers está executando a etapa com uso intensivo da CPU.
Se o ajuste correto estiver ativado e uma dica de recurso for aplicada à etapa que exige GPU, o pipeline vai criar dois pools separados. Assim, o estágio com uso intenso de CPU será executado pelo pool de workers de CPU, e o estágio que exige GPU será executado pelo pool de workers de GPU.
Para este exemplo de pipeline, a tabela de escalonamento automático mostra que o pool de workers que executa a etapa com uso intensivo de CPU, Pool 0, é inicialmente escalonado para 99 workers e, posteriormente, reduzido para 87. O pool de workers que executa a etapa que exige GPU, Pool 1, é escalonado para 13 workers:
O gráfico de utilização da CPU mostra que os workers nos dois pools estão demonstrando uma alta utilização geral da CPU:
Resolver problemas de ajuste direito
Esta seção fornece instruções para solucionar problemas comuns relacionados ao ajuste direito.
Configuração inválida
Quando você tenta usar o ajuste direito, ocorre o seguinte erro:
Workflow failed. Causes: One or more operations had an error: 'operation-OPERATION_ID':
[UNSUPPORTED_OPERATION] 'NUMBER vCpus with NUMBER MiB memory is
an invalid configuration for NUMBER count of 'GPU_TYPE' in family 'MACHINE_TYPE'.'.
Esse erro ocorre quando o tipo de GPU selecionado não é compatível com o tipo de máquina selecionado. Para resolver esse erro, selecione um tipo de GPU e de máquina compatíveis. Para detalhes de compatibilidade, consulte Plataformas de GPU.
Verificar o ajuste direito
Para verificar se o ajuste correto está ativado, confira as métricas de escalonamento automático e verifique se a coluna Worker pool está visível e lista diferentes pools:
Performance de ajuste direito de streaming
Os pipelines de streaming com ajuste direito ativado nem sempre têm um desempenho melhor do que aqueles sem esse recurso. Exemplo:
- O pipeline está usando mais workers
- A latência do sistema é maior ou a capacidade de processamento é menor
- Os tamanhos dos pools de workers estão mudando com mais frequência ou não estão se estabilizando.
Se isso acontecer com seu pipeline, desative o ajuste à direita removendo a opção de pipeline --experiments=enable_streaming_rightfitting. Além disso, os pipelines de streaming com ajuste direito ativado usando dicas de recursos do acelerador podem usar mais aceleradores do que o desejado. Se isso acontecer com seu pipeline, configure um número máximo de aceleradores usados por ele definindo a opção de pipeline --experiments=max_num_accelerators=NUM.