Visão geral da comparação de arquivos

Esta página descreve a comparação de arquivos de execução dupla, que foi projetada para ajudar você a comparar as saídas de cargas de trabalho em lote. Com esse recurso, é possível garantir que os jobs em lote executados no mainframe e no Google Cloud gerem saídas idênticas para as mesmas entradas.

Como as comparações de arquivos funcionam

O recurso de comparação de arquivos da execução dupla permite analisar arquivos. Para isso, primeiro configure as definições de comparação, depois configure os gatilhos para iniciar o processo e, por fim, analise os resultados.

Saiba como a comparação de arquivos funciona nas seções a seguir.

Diagrama de comparação em lote

Transferência de arquivos do mainframe

Antes de executar uma comparação de arquivos, a primeira etapa é transferir arquivos do mainframe para um bucket do Cloud Storage em Google Cloud.

É possível transferir arquivos do mainframe de duas maneiras:

Nos dois casos, a execução dupla pode ler formatos EBCDIC e oferece suporte à saída UNLOAD sem a necessidade de nenhuma transformação adicional.

Configuração de comparação

A execução dupla oferece flexibilidade total sobre como comparar seus arquivos de mainframe e modernizados. Para cada arquivo, especifique quais campos comparar e os formatos esperados.

A comparação de arquivos de execução dupla oferece suporte a opções configuráveis avançadas, como ofuscação de dados, configurações de tolerância, mesclagem de campos, rótulos personalizados e filtragem para análise de arquivos precisa e flexível.

  • Ofusque campos específicos ao realizar a comparação de arquivos. Isso é útil para ocultar dados sensíveis que não devem aparecer nos relatórios ou nos painéis como conteúdo claramente visível.
  • Permita tolerância ao comparar valores numéricos de campos específicos. Isso é útil ao comparar números de ponto flutuante originários de sistemas diferentes.
  • Permita tolerância ao comparar valores de carimbo de data/hora de campos específicos. Isso é útil ao comparar carimbos de data/hora originários de sistemas diferentes.
  • Mescle vários campos com uma string de junção opcional e trate-os como um único campo durante a comparação.
  • Configure rótulos personalizados para categorizar seus jobs de comparação. Os rótulos são pares de chave-valor que podem ser usados para marcar seus jobs de comparação e diferenciá-los entre diferentes objetivos funcionais ou de negócios.
  • Ignore espaços em branco à esquerda e à direita em campos específicos.
  • Ignorar a diferença entre maiúsculas e minúsculas em strings.
  • Aplique filtros para ignorar registros durante a comparação, permitindo que vários filtros sejam aplicados ao mesmo tempo.

Geração de configuração automatizada

A execução dupla oferece ferramentas automatizadas para ajudar a configurar a comparação de arquivos. Essas ferramentas criam os arquivos de configuração necessários com base nos copybooks do mainframe ou em arquivos JSON e CSV de amostra que você fornece.

Comparar resultados

Ao comparar dois arquivos, a execução dupla retorna três resultados possíveis:

  • Correspondência completa:o registro está presente nos dois arquivos, e o conteúdo dos campos corresponde às restrições especificadas.
  • Correspondência parcial:o registro está presente nos dois arquivos, mas alguns dos campos não correspondem. É possível verificar as diferenças na saída de resultados.
  • Registro ausente:o registro está presente apenas nos arquivos reais ou esperados.

Em caso de incompatibilidade entre os arquivos comparados, você pode configurar a execução dupla para mostrar todos os registros comparados nos arquivos, e não apenas os registros incompatíveis, para facilitar a solução de problemas.

A execução dupla oferece um recurso chamado comparações adiadas para resolver situações em que os dados podem estar temporariamente ausentes. Isso é particularmente útil para comparações iterativas, como as realizadas em snapshots diários do banco de dados. Se um campo estiver ausente em uma iteração, mas aparecer na próxima, a execução dupla vai armazená-lo e compará-lo mais tarde, garantindo que nenhuma discrepância de dados seja criada. Isso oferece um processo de comparação mais robusto e preciso, especialmente para conjuntos de dados dinâmicos.

Arquivos compatíveis

A execução dupla oferece suporte aos seguintes arquivos para comparação:

  • Arquivos sequenciais de bloco fixo z/OS
  • Arquivos de matriz JSON
  • Arquivos de linhas JSON (JSONL)
  • Arquivos CSV

Tipos de dados z/OS compatíveis

A execução dupla oferece suporte aos seguintes tipos de dados z/OS, tanto em EBCDIC quanto em ASCII:

  • COMP1
  • COMP2
  • PACKED_DECIMAL
  • COMP4
  • COMP5
  • ZONED_DECIMAL
  • ALPHANUMERIC

Arquivos JSON compatíveis

A execução dupla oferece suporte aos seguintes formatos JSON:

  • JSONL: nesse arquivo, cada linha contém um único objeto JSON. Não há novas linhas no objeto.
  • Matriz JSON: nesse arquivo, há suporte para dois tipos de arquivos:
    • Uma matriz JSON em que toda a matriz e os elementos estão em uma única linha. Não há novas linhas nesse arquivo.
    • Uma matriz JSON com uma nova linha separando os elementos na matriz. Cada objeto JSON também pode conter novas linhas.

Arquivos CSV compatíveis

A execução dupla oferece suporte a arquivos CSV que seguem o padrão RFC 4180. É possível configurar como a execução dupla analisa o arquivo, incluindo delimitadores, cabeçalhos, caracteres de escape e várias linhas.

A seguir

Saiba mais sobre a comparação on-line.