本頁面說明如何在 Cloud Data Fusion Studio 的 Wrangler 工作區中準備資料時,遮蓋敏感資料。您可以遮蓋任何資料類型資料欄中的資料,但布林值和位元組類型除外。
- 前往 Cloud Data Fusion 中的 Wrangler 工作區。
- 在「資料」分頁中,前往所需欄名,然後按一下展開箭頭 arrow_drop_down。
- 選取「遮罩」,然後選取所需選項,例如「自訂選取範圍」。我們會在以下各節中說明這些選項。
轉換會套用至 Wrangler 工作區的「資料」分頁中顯示的預覽資料。Wrangler 會在食譜中加入遮罩指令。執行資料管道時,系統會將轉換套用至資料欄中的所有值。
只顯示最後四個字元
「只顯示最後 4 個字元」遮罩選項會將 mask-number
指令新增為轉換步驟,加入到方案中。
只顯示最後兩個字元
「只顯示最後 2 個字元」遮蔽選項會將 mask-number
指令新增為轉換步驟,加入到方案中。
自訂選項
使用「自訂選取項目」遮罩選項,可選取要遮罩的儲存格字元位置,並遮罩資料欄中每個資料列中同樣位置的字元。舉例來說,在包含 10 個字元的字串儲存格中,選取字串的前 8 個字元,會導致資料欄中每列的前 8 個字元都會遭到遮罩。
如要選取要遮蓋的特定字元,請按照下列步驟操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作區。
- 在「資料」分頁中,前往所需欄名,然後按一下展開箭頭 arrow_drop_down。
- 依序選取「遮罩」>「自訂選取範圍」。可遮罩的資料欄值會以藍色背景顯示。
- 在資料欄的任一儲存格中,選取要遮蓋的字元。
- 按一下 [套用]。
系統會為資料欄中的所有欄位遮蓋該值的部分。
自訂選項會將 mask-number
指示新增至食譜。執行資料管道時,系統會將轉換套用至資料欄中的所有值。
隨機播放
「By shuffling」遮蓋選項會將隨機遮蓋模式套用至資料欄中的每個欄位。Wrangler 會將 mask-shuffle
指令新增為轉換步驟,並加入至食譜中。
後續步驟
- 進一步瞭解 Wrangler 指令。