Auf dieser Seite wird der Dual Run-Dateivergleich beschrieben, mit dem Sie die Ausgaben von Batcharbeitslasten vergleichen können. Mit dieser Funktion können Sie dafür sorgen, dass die Batchjobs, die auf dem Mainframe und auf Google Cloud ausgeführt werden, für dieselben Eingaben identische Ausgaben erzeugen.
So funktionieren Dateivergleiche
Mit der Funktion zum Dateivergleich von Dual Run können Sie Dateien analysieren. Dazu müssen Sie zuerst die Vergleichseinstellungen konfigurieren, dann die Trigger einrichten, um den Prozess zu starten, und schließlich die Ergebnisse überprüfen.
In den folgenden Abschnitten erfahren Sie, wie der Dateivergleich funktioniert.

Dateiübertragung vom Mainframe
Bevor Sie einen Dateivergleich durchführen können, müssen Sie zuerst Dateien vom Mainframe in einen Cloud Storage-Bucket in Google Cloudübertragen.
Sie haben zwei Möglichkeiten, Dateien vom Mainframe zu übertragen:
- mit FTP-/HTTPS-Übertragungen
- mit dem Mainframe Connector.
In beiden Fällen kann Dual Run EBCDIC-Formate lesen und unterstützt die UNLOAD-Ausgabe ohne zusätzliche Transformation.
Vergleichskonfiguration
Mit Dual Run haben Sie die volle Flexibilität beim Vergleich Ihrer Mainframe- und modernisierten Dateien. Für jede Datei geben Sie an, welche Felder verglichen werden sollen, und die erwarteten Formate.
Der Dual Run-Dateivergleich unterstützt erweiterte konfigurierbare Optionen wie Datenverschleierung, Toleranzeinstellungen, Zusammenführen von Feldern, benutzerdefinierte Labels und Filterung für eine präzise und flexible Dateianalyse.
- Bestimmte Felder verschleiern, wenn Sie den Dateivergleich durchführen. Das ist nützlich, um vertrauliche Daten auszublenden, die nicht als deutlich sichtbarer Inhalt in den Berichten oder Dashboards angezeigt werden sollen.
- Toleranz beim Vergleich numerischer Werte bestimmter Felder zulassen. Das ist nützlich, wenn Sie Gleitkommazahlen aus verschiedenen Systemen vergleichen.
- Toleranz beim Vergleich von Zeitstempelwerten bestimmter Felder zulassen. Das ist nützlich, wenn Sie Zeitstempel aus verschiedenen Systemen vergleichen.
- Mehrere Felder mit einem optionalen Verknüpfungsstring zusammenführen und sie beim Vergleich als ein einzelnes Feld behandeln.
- Benutzerdefinierte Labels konfigurieren, um Ihre Vergleichsjobs zu kategorisieren. Labels sind Schlüssel-Wert-Paare, mit denen Sie Ihre Vergleichsjobs taggen und sie nach verschiedenen funktionalen oder geschäftlichen Zielen unterscheiden können.
- Voran- und nachgestellte Leerzeichen in bestimmten Feldern ignorieren.
- Groß- und Kleinschreibung in Strings ignorieren.
- Filter anwenden, um Datensätze beim Vergleich zu ignorieren, wobei mehrere Filter gleichzeitig angewendet werden können.
Automatisierte Konfigurationsgenerierung
Dual Run bietet automatisierte Tools, mit denen Sie den Dateivergleich konfigurieren können. Diese Tools erstellen die erforderlichen Konfigurationsdateien basierend auf Ihren Mainframe-Copybooks oder auf JSON- und CSV-Beispieldateien, die Sie bereitstellen.
Vergleichsergebnisse
Beim Vergleich von zwei Dateien gibt Dual Run drei mögliche Ergebnisse zurück:
- Vollständige Übereinstimmung:Der Datensatz ist in beiden Dateien vorhanden und der Inhalt der Felder entspricht den angegebenen Einschränkungen.
- Teilweise Übereinstimmung:Der Datensatz ist in beiden Dateien vorhanden, aber einige Felder stimmen nicht überein. Sie können die Unterschiede in der Ergebnisausgabe prüfen.
- Fehlender Datensatz:Der Datensatz ist nur in den tatsächlichen oder erwarteten Dateien vorhanden.
Bei einer Abweichung zwischen den verglichenen Dateien können Sie Dual Run so konfigurieren, dass alle verglichenen Datensätze in den Dateien angezeigt werden und nicht nur die Datensätze mit Abweichungen, um die Fehlerbehebung zu erleichtern.
Dual Run bietet eine Funktion namens Verzögerte Vergleiche für Situationen, in denen Daten vorübergehend fehlen. Das ist besonders nützlich für iterative Vergleiche, z. B. für tägliche Datenbank-Snapshots. Wenn ein Feld in einer Iteration fehlt, aber in der nächsten vorhanden ist, speichert und vergleicht Dual Run es später, um Datenabweichungen zu vermeiden. So wird ein robusterer und genauerer Vergleichsprozess ermöglicht, insbesondere für dynamische Datensätze.
Unterstützte Dateien
Dual Run unterstützt die folgenden Dateien für den Vergleich:
- Sequenzielle Dateien mit fester Blockgröße für z/OS
- JSON-Array-Dateien
- JSON Lines-Dateien (JSONL)
- CSV-Dateien
Unterstützte z/OS-Datentypen
Dual Run unterstützt die folgenden z/OS-Datentypen in EBCDIC und ASCII:
- COMP1
- COMP2
- PACKED_DECIMAL
- COMP4
- COMP5
- ZONED_DECIMAL
- ALPHANUMERIC
Unterstützte JSON-Dateien
Dual Run unterstützt die folgenden JSON-Formate:
- JSONL: In dieser Datei enthält jede Zeile ein einzelnes JSON-Objekt. Innerhalb des Objekts sind keine Zeilenumbrüche vorhanden.
- JSON-Array: In dieser Datei werden zwei Dateitypen unterstützt:
- Ein JSON-Array, in dem sich das gesamte Array und die Elemente in einer einzigen Zeile befinden. In dieser Datei gibt es keine Zeilenumbrüche.
- Ein JSON-Array mit einem Zeilenumbruch, der die Elemente im Array trennt. Jedes JSON-Objekt kann auch Zeilenumbrüche enthalten.
Unterstützte CSV-Dateien
Dual Run unterstützt CSV-Dateien, die dem RFC 4180-Standard entsprechen. Sie können konfigurieren, wie Dual Run die Datei parst, einschließlich Trennzeichen, Kopfzeilen, Escapezeichen und mehrzeiliger Inhalte.
Nächste Schritte
Informationen zum Online-Vergleich