SAP ERP-Datenquelle
Für die Data Foundation-Ebene des Google Cloud Cortex Framework für SAP ERP ist eine Verbindung zu den Rohdaten des Quellsystems erforderlich. Sowohl SAP ECC als auch SAP S/4HANA werden unterstützt.
Bevor Sie Cortex Framework-Inhalte bereitstellen, müssen relevante SAP ERP-Tabellen in BigQuery repliziert werden. Sie können dies erreichen, indem Sie Daten in einem dedizierten Dataset der Rohdatenebene für die Verarbeitung von Change Data Capture (CDC) ablegen oder etablierte CDC-Pipelines verwenden, um die Data Foundation-Ebene direkt zu speisen. Weitere Informationen finden Sie unter Technische Anforderungen für die Replikation von SAP ERP-Daten.
Sie können ein beliebiges Replikationstool verwenden, sofern damit Daten im Rohdatenformat in BigQuery repliziert werden können.Google Cloud -Lösungen umfassen beispielsweise den BigQuery-Connector für SAP (erfordert SAP SLT) und das BigQuery-Toolkit für SAP.
Damit die replizierten Rohdatensets aus SAP ERP mit der Data Foundation-Ebene des Cortex Framework kompatibel sind, müssen Sie die folgenden Anforderungen erfüllen.
Technische Anforderungen für die Replikation von SAP ERP-Daten
Prüfen und erfüllen Sie die folgenden technischen Anforderungen für die Replikation von SAP-Daten in das Cortex Framework in BigQuery.
Rohdatenstruktur: Daten aus ECC oder S/4HANA sollten in BigQuery mit derselben Struktur wie die Basistabellen in SAP und ohne Geschäftstransformationen eingehen. Tabellen müssen mit den erforderlichen Feldnamen, ‑typen und der erforderlichen Granularität repliziert werden, wie sie in SAP vorhanden sind.
Tabellenkonfiguration: Die Liste der zu transformierenden Tabellen wird in der Datei
table_settings.yaml(unterconfig/cortex/data_foundation/sap) definiert. Wenn bei der Bereitstellung eine erforderliche Tabelle fehlt, schlagen die entsprechenden Datenprodukte fehl.Metadatenanforderungen: Sie müssen Metadatentabellen wie
DD03Laus Ihrer SAP-Quelle in das Rohdatenset replizieren, das als Quelle für Ihr Fundamentmodul inconfig/config.yamlkonfiguriert ist. Diese Metadatentabellen müssen zwar im Rohdatenset vorhanden sein, dürfen aber nicht in der Dateitable_settings.yamlfür die Datenbasis enthalten sein und werden nicht von der Datenbasisschicht verarbeitet. Achten Sie darauf, dass die replizierte TabelleDD03Ldie Feldmetadatensätze für alle Tabellen enthält, die Sie aufnehmen möchten, z. B. benutzerdefinierte oder zusätzliche Tabellen wiesflight. Die Build-Skripts und der Abhängigkeitsresolver des Cortex Framework lesen diese Metadatenzeilen, um Spaltenlisten, Datentypen und Primärschlüsselbeziehungen zwischen Tabellen zu ermitteln.Schreibweise: Die Namen der replizierten SAP-Tabellen in BigQuery müssen in Kleinbuchstaben angegeben werden, damit sie mit dem Cortex Framework-Datenmodell kompatibel sind. Die SAP-Tabelle
MARAwird beispielsweise in BigQuery zumara.Objektnamen (Spalten) und Sonderzeichen: Für Objektnamen (Spalten), die Sonderzeichen wie
/,-oder führende Unterstriche_enthalten, erwartet Cortex ein generisches Bereinigungsmuster:- Alle nicht alphanumerischen Zeichen werden durch einen Unterstrich
_ersetzt. - Führende Unterstriche und Ziffern sind nicht zulässig. Beispiel:
/GOOG/TESTwird zugoog_testund_DATAAGINGzudataaging. Wenn Ihr Replikationstool Daten mit führenden Unterstrichen beibehält, ist ein Normalisierungsschritt (Aliasing) in der Data Foundation-Schicht erforderlich.
- Alle nicht alphanumerischen Zeichen werden durch einen Unterstrich
Felder für die Datenübertragung: Zur Unterstützung von CDC (Change Data Capture) und der Datenübertragung müssen replizierte SAP-Tabellen Folgendes enthalten:
- Ein Vorgangs-Flag mit dem Namen
operation_flag(L= Initial Load,I= Insert,U= Update,D= Delete). - Ein Zeitstempel mit dem Namen
recordstamp(der zum Zeitpunkt des Ladevorgangs mit dem aktuellen Zeitstempel gefüllt wird). - Optional: In replizierten
_DS_RAW-Tabellen wird ein zusätzliches Feldis_deleted(BOOLEAN) ausgewählt (bei der ersten Ladung wird standardmäßig „false“ verwendet). Laufzeitansichten, die von Cortex generiert werden, verweisen auf diese Spalte. Sie kann jedoch vor der Ausführung aus den CDC- und Ansichtsvorlagen entfernt werden, wenn das Replikationstool sie nicht erzeugt.
- Ein Vorgangs-Flag mit dem Namen
Datentypen: Erforderliche Zuordnung von SAP-Datentypen zu BigQuery-Datentypen zur Gewährleistung der Kompatibilität:
Für Standardvorgänge erforderlich:
Datentyp „SAP“ Datentyp BigQuery Beschreibung DATS DATEDatentyp „Datum“ TIMS TIMEDatentyp „Zeit“ Für Präzision und Kompatibilität dringend empfohlen:
CURR(Währung) undQUAN(Menge) werdenNUMERICoderBIGNUMERICzugeordnet. Vermeiden SieFLOAT64, um Rundungsfehler bei Finanzberechnungen zu vermeiden.NUMC(Numerisches Zeichen) wirdSTRINGzugeordnet (um führende Nullen für Dokumentnummern und Artikelnummern beizubehalten und erfolgreiche Joins zu ermöglichen).
Nutzlastkomprimierung: Damit leere SAP-Spalten (Anfangswerte wie Leerzeichen oder Nullen) in BigQuery nicht mit
NULLgefüllt werden, muss die Nutzlastkomprimierung in der Connector-Konfiguration deaktiviert sein (oder „Unkomprimiert senden“ aktiviert sein). So wird dafür gesorgt, dass leere Strings oder Nullen im Ziel als solche beibehalten werden, anstatt standardmäßig aufNULLgesetzt zu werden.