Panoramica del confronto dei file

Questa pagina descrive il confronto dei file di doppia esecuzione, progettato per aiutarti a confrontare gli output dei carichi di lavoro batch. Con questa funzionalità, puoi assicurarti che i job batch in esecuzione sul mainframe e su Google Cloud generino output identici per gli stessi input.

Come funzionano i confronti tra file

La funzionalità di confronto dei file di Dual Run ti consente di analizzare i file configurando prima le impostazioni di confronto, poi impostando i trigger per avviare il processo e infine esaminando i risultati.

Scopri come funziona il confronto dei file nelle sezioni seguenti.

Diagramma di confronto batch

Trasferimento di file dal mainframe

Prima di poter eseguire un confronto tra file, il primo passo è trasferire i file dal mainframe a un bucket Cloud Storage in Google Cloud.

Puoi trasferire i file dal mainframe in due modi:

In entrambi i casi, Dual Run può leggere i formati EBCDIC e supporta l'output UNLOAD senza la necessità di ulteriori trasformazioni.

Configurazione del confronto

Dual Run ti offre la massima flessibilità per confrontare i file mainframe e modernizzati. Per ogni file, specifica i campi da confrontare e i relativi formati previsti.

Il confronto dei file Dual Run supporta opzioni avanzate configurabili, come l'offuscamento dei dati, le impostazioni di tolleranza, l'unione dei campi, le etichette personalizzate e il filtro per un'analisi precisa e flessibile dei file.

  • Offusca campi specifici quando esegui il confronto dei file. Ciò è utile per nascondere dati sensibili che non devono essere visualizzati nei report o nelle dashboard come contenuti chiaramente visibili.
  • Consenti la tolleranza durante il confronto dei valori numerici di campi specifici. Questo è utile quando si confrontano numeri in virgola mobile provenienti da sistemi diversi.
  • Consenti la tolleranza durante il confronto dei valori timestamp di campi specifici. Questo è utile quando si confrontano timestamp provenienti da sistemi diversi.
  • Unisci più campi con una stringa di unione facoltativa e considerali come un unico campo durante il confronto.
  • Configura etichette personalizzate per classificare i job di confronto. Le etichette sono coppie chiave-valore che puoi utilizzare per taggare i job di confronto e per differenziarli in base a diversi obiettivi funzionali o commerciali.
  • Ignora gli spazi vuoti iniziali e finali in campi specifici.
  • Ignora maiuscole e minuscole nelle stringhe.
  • Applica filtri per ignorare i record durante il confronto, consentendo l'applicazione di più filtri contemporaneamente.

Generazione automatica della configurazione

Dual Run fornisce strumenti automatizzati per configurare il confronto dei file. Questi strumenti creano i file di configurazione richiesti in base ai copybook del mainframe o a file JSON e CSV di esempio che fornisci.

Risultati del confronto

Quando si confrontano due file, Dual Run restituisce tre possibili risultati:

  • Corrispondenza esatta:il record è presente in entrambi i file e il contenuto dei campi corrisponde ai vincoli specificati.
  • Corrispondenza parziale:il record è presente in entrambi i file, ma alcuni campi non corrispondono. Puoi controllare le differenze nell'output dei risultati.
  • Record mancante:il record è presente solo nei file effettivi o previsti.

In caso di mancata corrispondenza tra i file confrontati, puoi configurare Dual Run per mostrare tutti i record confrontati all'interno dei file e non solo i record non corrispondenti, per semplificare la risoluzione dei problemi.

Dual Run offre una funzionalità chiamata confronti differiti per risolvere le situazioni in cui i dati potrebbero mancare temporaneamente. Ciò è particolarmente utile per i confronti iterativi, come quelli eseguiti sugli snapshot giornalieri del database. Se un campo è assente in un'iterazione, ma viene visualizzato in quella successiva, Dual Run lo memorizza e lo confronta in un secondo momento, assicurandosi che non vengano create discrepanze nei dati. In questo modo si ottiene un confronto più solido e accurato, soprattutto per i set di dati dinamici.

File supportati

Dual Run supporta i seguenti file per il confronto:

  • File sequenziali a blocchi fissi z/OS
  • File di array JSON
  • File JSON Lines (JSONL)
  • File CSV

Tipi di dati z/OS supportati

Dual Run supporta i seguenti tipi di dati z/OS, sia in EBCDIC che in ASCII:

  • COMP1
  • COMP2
  • PACKED_DECIMAL
  • COMP4
  • COMP5
  • ZONED_DECIMAL
  • ALPHANUMERIC

File JSON supportati

Dual Run supporta i seguenti formati JSON:

  • JSONL: in questo file, ogni riga contiene un singolo oggetto JSON. Non sono presenti nuove righe all'interno dell'oggetto.
  • Array JSON: in questo file sono supportati due tipi di file:
    • Un array JSON in cui l'intero array e gli elementi si trovano su una sola riga. Non ci sono interruzioni di riga in questo file.
    • Un array JSON con una nuova riga che separa gli elementi dell'array. Ogni oggetto JSON può contenere anche nuove righe.

File CSV supportati

Dual Run supporta i file CSV conformi allo standard RFC 4180. Puoi configurare la modalità di analisi del file da parte di Dual Run, inclusi delimitatori, intestazioni, caratteri di escape e multiriga.

Passaggi successivi

Scopri come installare e iniziare a utilizzare Dual Run.