本頁面說明如何在 Cloud Data Fusion Studio 的 Wrangler 工作區中準備資料時進行篩選。在 Wrangler 中,您可以篩選任何資料類型 (布林值類型除外) 的資料欄中的資料列。您可以根據所設定的條件保留或移除資料列。
如要根據條件保留或移除資料列,請按照下列步驟操作:
- 前往 Cloud Data Fusion 中的 Wrangler 工作區。
- 在「資料」分頁中,前往所需欄名,然後按一下展開箭頭 arrow_drop_down。
- 選取「篩選器」,然後選取所需選項,例如「保留資料列」和「如果值包含」。
- 指定條件。
- 按一下 [套用]。
這些值會因篩選器而異。Wrangler 會將 filter-rows-on 指令加入至食譜。執行資料管道時,系統會將轉換套用至資料欄中的值。
保留資料列
如果您選擇依據條件保留資料列,系統會移除不符合條件的資料列。資料集中只會保留符合條件的資料列。舉例來說,如果您選取「value is」並輸入條件 Customer,Wrangler 會保留含有字串 Customer 的資料列,並移除其他值的資料列。
移除資料列
如果您選擇依據條件移除資料列,系統會從資料集中移除符合條件的資料列。舉例來說,如果您移除資料列並選取「值為空白」,Wrangler 就會從資料欄移除含有空白或空值的資料列。
支援的篩選條件
您可以根據下列條件篩選資料列:
| 條件 | 說明 |
|---|---|
| 值為空白 | 保留或移除含有空白值的值。 |
| 值為 | 保留或移除含有確切指定值的值。對於包含字串資料類型的資料欄,您可以選擇忽略大小寫。預設會在條件中加入大小寫。 |
| value contains | 保留或移除包含指定值的值。 |
| 值開頭為 | 保留或移除以指定值開頭的值。 |
| 值結尾為 | 保留或移除以指定值結尾的值。 |
| 與規則運算式相符 | 保留或移除符合規則運算式的值。 |
| 自訂條件 | 保留或移除符合自訂條件的值。 |
後續步驟
- 進一步瞭解 Wrangler 指令。