Para que os recursos da VM estejam disponíveis quando os jobs do Dataflow precisarem deles, use as reservas do Compute Engine. As reservas fornecem um nível alto de garantia da capacidade dos recursos zonais do Compute Engine.
Para usar as reservas do Compute Engine com o Dataflow, siga estas etapas:
Crie uma reserva do Compute Engine. Pode ser uma reserva de projeto único ou compartilhada. Confira mais informações nestes documentos:
A reserva pode incluir aceleradores de GPU ou TPU.
Ao enviar o job do Dataflow, transmita uma das seguintes opções de serviço, dependendo da versão do SDK do Beam que você estiver usando:
- Versão do Beam anterior à 2.29:
--experiments=skip_gce_quota_verification - Versão do Beam 2.29 ou mais recente:
--dataflow_service_options=automatically_use_created_reservation
- Versão do Beam anterior à 2.29:
Para evitar que as cargas de trabalho de baixa prioridade no mesmo projeto concorram por
reservas com o Dataflow, defina a afinidade de reserva como
none ao criar VMs para essas cargas de trabalho. Saiba mais em
Consumir instâncias reservadas.
Para usar a reserva, os workers do Dataflow precisam corresponder à configuração da reserva. Talvez seja necessário definir o tipo de máquina do worker para o job. Saiba mais em Workers.
Limitações
Todas as limitações das reservas do Compute Engine se aplicam quando os workers do Dataflow consomem as reservas. Veja Como funcionam as reservas.
O Dataflow depende da ordem de consumo padrão no Compute Engine. Como resultado, as seguintes limitações se aplicam:
- Outras cargas de trabalho no mesmo projeto ou organização que não especificarem a flag
--reservationpodem competir com as cargas de trabalho do Dataflow por reservas compartilhadas ou específicas do projeto.
- Outras cargas de trabalho no mesmo projeto ou organização que não especificarem a flag
Os jobs do Dataflow Prime não consomem reservas do Compute Engine.
Reservas e aceleradores
O Dataflow é compatível com reservas especificamente direcionadas para pipelines que usam aceleradores (GPUs ou TPUs). Essa funcionalidade está em disponibilidade geral com uma lista de permissões. Para instruções sobre como usar aceleradores do Dataflow com reservas específicas, entre em contato com sua equipe de conta.
Preços
O Dataflow cobra pelas VMs de reservas consumidas automaticamente enquanto o job do Dataflow está em execução. Quando o Dataflow não está usando as VMs, o Compute Engine faz a cobrança.
Modelo de preços do Compute Engine
Se o uso do Dataflow incluir VMs de reservas especificamente direcionadas que têm GPUs ou TPUs, os recursos de computação dessas VMs reservadas serão faturados de acordo com os preços do Compute Engine. Se as reservas especificamente segmentadas estiverem vinculadas a um compromisso com base em recursos do Compute Engine, você também vai receber os descontos por uso contínuo (CUDs) com base em recursos aplicáveis ao seu uso. Você também recebe uma cobrança premium de gerenciamento pelos recursos de computação consumidos no Dataflow. Para mais detalhes sobre preços, consulte Preços do Dataflow.
Modelo de preços do Dataflow
Para qualquer outro tipo de reserva do Compute Engine que você use com o Dataflow, o uso é cobrado usando o modelo de preços do Dataflow. O uso do Dataflow dessas reservas não se qualifica para CUDs baseados em recursos, mesmo que elas estejam anexadas a um compromisso desse tipo. Isso se aplica às seguintes reservas do Compute Engine:
- Reservas com direcionamento específico que não têm GPUs ou TPUs
- Todas as reservas consumidas automaticamente
A seguir
Saiba mais sobre as reservas do Compute Engine em Reservas de recursos zonais do Compute Engine.