Arquitetura de lote

Esta página descreve a arquitetura do Dual Run para comparação em lote e os componentes dele.

Visão geral da arquitetura do Dual Run

O Dual Run é implantado no seu próprio projeto particular Google Cloud e é executado como um conjunto de microsserviços no Google Kubernetes Engine (GKE), interagindo com outros produtos Google Cloud .

O diagrama a seguir mostra a arquitetura do Dual Run para comparação de arquivos em lote, conforme descrito com mais detalhes nas seções a seguir.

Arquitetura de execução dupla para jobs de comparação em lote

Arquitetura do Dual Run com um job de comparação de arquivos entre o mainframe e Google Cloudo.

Componentes do Dual Run

O Dual Run tem os seguintes componentes:

  • Comparação de arquivos
  • Config Manager: interface e painéis
  • Env Checker

Comparação de arquivos

A comparação de arquivos é um componente do Dual Run que permite comparar as saídas de arquivos esperadas e reais da configuração do Dual Run. Ao realizar uma comparação, é possível definir o nível de tolerância para marcar os resultados como equivalentes.

A comparação de arquivos usa Managed Service for Apache Spark, um cluster do Apache Spark totalmente gerenciado em execução no Google Cloud, para realizar a comparação. O Managed Service for Apache Spark pode ser configurado de duas maneiras, dependendo do tamanho dos dados que você planeja comparar e dos requisitos de infraestrutura:

  • Um ambiente gerenciado sem servidor baseado no Spark em execução no Google Cloud Managed Service for Apache Spark que é criado como parte da implantação do Dual Run. Ele usa uma configuração fixa que permite comparar arquivos de até vários GB.
  • Um cluster do Spark no Managed Service for Apache Spark que você cria e configura após a implantação do Dual Run. Isso é útil nos seguintes casos:
    • Você planeja usar VMs especiais ou configurações de disco.
    • Você precisa comparar arquivos maiores que vários GB.
    • Você quer executar vários jobs de comparação ao mesmo tempo.

Config Manager

O Config Manager é o front-end do Dual Run. Esse componente permite configurar o acesso e as permissões do usuário, usando o Google Cloud Identity and Access Management.

O Config Manager também fornece o ambiente do painel em que é possível analisar os resultados dos jobs de comparação de arquivos. O painel permite visualizar um resumo dos resultados da comparação com base nos filtros aplicados e analisar os detalhes dos resultados de cada registro individual. Ele também permite criar relatórios e consultas personalizados.

Env Checker

O Env Checker é o componente do Dual Run que verifica se a instalação e a implantação do Dual Run foram concluídas. Ele verifica se todos os componentes necessários do Dual Run estão configurados e em execução corretamente e informa erros ou configurações incorretas.

Google Cloud Dependências

O Dual Run depende internamente de vários Google Cloud serviços. Eles são ativados e configurados automaticamente durante a implantação do Dual Run, e não é necessário configurá-los manualmente.

  • Google Kubernetes Engine (GKE): o Dual Run usa o GKE para executar microsserviços em pods.
  • Cloud Storage: o Dual Run usa buckets do Storage para armazenar os arquivos de configuração do ambiente e os artefatos que você quer comparar.
  • BigQuery: o Dual Run usa o BigQuery para armazenar os resultados das saídas de comparação de arquivos.
  • Pub/Sub: o Dual Run usa o Pub/Sub como um sistema de mensagens interno para transmitir mudanças de configuração entre os diferentes pods.
  • Managed Service for Apache Spark: o Dual Run usa o Managed Service for Apache Spark para criar um cluster do Spark sem servidor que pode ser usado para executar a comparação de arquivos.
  • Workflows e Cloud Functions: o Dual Run usa o Workflows para gerenciar as Cloud Functions que executam os jobs de comparação de arquivos.
  • Identity Platform: o Dual Run depende do Identity Platform como um serviço de autenticação, que oferece recursos de gerenciamento de identidade e acesso. O Identity Platform permite usar provedores de identidade do Google ou SAML para autenticar usuários e autorizar papéis.
  • Cloud SQL: o Dual Run cria uma instância de um banco de dados do Cloud SQL para compatibilidade com as atualizações futuras.

A seguir

Saiba mais sobre a comparação de arquivos do Dual Run File Comparison, que é o componente responsável por comparar os dados gerados pelo mainframe e pelo aplicativo moderno Google Cloud application.