SAP ERP 資料來源
適用於 SAP ERP 的 Google Cloud Cortex Framework 資料基礎層需要連線至來源系統原始資料。SAP ECC 和 SAP S/4HANA 皆支援。
部署 Cortex Framework 內容前,必須先將相關的 SAP ERP 資料表複製到 BigQuery。如要達成這個目標,請在專用的原始層資料集登陸資料,以進行變更資料擷取 (CDC) 處理,或使用已建立的 CDC 管道直接饋送資料基礎層。詳情請參閱「複製 SAP ERP 資料的技術相關規定」。
只要能以原始資料表格式將資料複製到 BigQuery,您可以使用任何複製工具。舉例來說,Google Cloud 解決方案包括 BigQuery Connector for SAP (需要 SAP SLT) 和 BigQuery Toolkit for SAP。
為確保從 SAP ERP 複製的原始資料集與 Cortex Framework 資料基礎層相容,請務必符合下列需求。
複製 SAP ERP 資料的技術相關規定
請務必查看並完成下列技術規定,將 SAP 資料複製到 BigQuery 中的 Cortex Framework。
原始資料結構:來自 ECC 或 S/4HANA 的資料應以與 SAP 基礎資料表相同的結構,且不經業務轉換,直接匯入 BigQuery。資料表必須以 SAP 中的必要欄位名稱、類型和精細度進行複製。
資料表設定:要轉換的資料表清單定義於
table_settings.yaml檔案 (位於config/cortex/data_foundation/sap底下)。如果在部署期間缺少必要資料表,依附於該資料表的特定資料產品就會失敗。中繼資料規定:您必須從 SAP 來源複製資料表
DD03L。這個資料表含有欄位中繼資料和鍵,對依附元件解析器至關重要。大小寫:為確保與 Cortex Framework 資料模型相容,BigQuery 中複製的 SAP 資料表名稱必須為小寫 (例如,SAP 資料表
MARA在 BigQuery 中會變成mara)。物件名稱 (資料欄) 和特殊字元:如果物件名稱 (資料欄) 含有特殊字元 (例如
/、-或開頭底線_),Cortex 會採用一般清除模式:- 所有非英數字元都會替換為底線
_。 - 開頭不得為底線和數字。舉例來說,
/GOOG/TEST會轉換為goog_test,_DATAAGING會轉換為dataaging。如果您的複製工具會保留開頭底線,則必須在資料基礎層執行正規化步驟 (別名)。
- 所有非英數字元都會替換為底線
資料傳播欄位:為支援 CDC (變更資料擷取) 和資料傳播,複製的 SAP 表格必須具備下列項目:
- 名為
operation_flag的作業旗標 (L= 初始載入、I= 插入、U= 更新、D= 刪除)。 - 名為
recordstamp的時間戳記 (在載入時填入目前的時間戳記)。 - 選用:在複製的
_DS_RAW資料表中選擇額外欄位is_deleted(BOOLEAN),初始載入時預設為 false。Cortex 產生的執行階段檢視畫面會參照這個資料欄,但如果複製工具未產生這個資料欄,則可先從 CDC 和檢視畫面範本中移除,再執行作業。
- 名為
資料類型:為了確保相容性,必須將 SAP 資料類型對應至 BigQuery 資料類型:
標準作業的必要條件:
資料類型 SAP BigQuery 資料類型 說明 DATS DATE日期資料類型 TIMS TIME時間資料類型 強烈建議使用,可確保精確度和相容性:
CURR(幣別) 和QUAN(數量) 對應至NUMERIC或BIGNUMERIC(請避免使用FLOAT64,以免財務計算發生四捨五入錯誤)。NUMC(數字字元) 對應至STRING(保留文件編號和項目編號開頭的零,確保聯結成功)。
酬載壓縮:為避免 BigQuery 中填入空白 SAP 欄 (初始值為空格或零),請確保在連接器設定中停用酬載壓縮 (或啟用「傳送未壓縮的資料」)。
NULL這可確保空字串或零會保留在目標中,而不是預設為NULL。