本頁面說明您可以在 Wrangler 中使用的指令。
在 Wrangler Power 模式 (Wrangler CLI) 中,您可以將指令和函式新增至食譜。詳情請參閱「Wrangler CLI 指示語」和「Wrangler 函式」。
Wrangler 支援下列指令:
資料欄作業
指令 | 說明 |
---|---|
變更欄大小寫 | 將資料欄名稱變更為小寫或大寫。 |
更換充電盒 | 變更資料欄值的大小寫。 |
清除資料欄名稱 | 根據特定規則清除資料欄名稱。 |
欄 Replace | 大量變更資料欄名稱。 |
複製 | 將來源資料欄的值複製到目標資料欄。 |
放置資料欄 | 刪除記錄中的資料欄。 |
填入空值或空白 | 如果值為空值或空白,請輸入固定欄值。 |
Keep | 保留記錄中的指定欄。 |
Merge | 插入第三個資料欄,合併兩個資料欄。 |
重新命名 | 重新命名記錄中現有的資料欄。 |
設定標頭 | 依照指定順序,設定資料欄名稱。 |
分割為欄 | 根據分隔符號將資料欄分割為多個資料欄。 |
交換 | 交換兩個資料欄的名稱。 |
設定類型 | 轉換資料欄的資料類型。 |
日期轉換
指令 | 說明 |
---|---|
差異日期 | 計算兩個日期之間的差距。 |
格式化日期 | 日期時間格式的自訂模式。 |
格式化 UNIX 時間戳記 | 將 UNIX 時間戳記格式化為日期。 |
日期時間轉換
指令 | 說明 |
---|---|
目前日期時間 | 使用指定時區產生目前的日期時間。 |
日期時間到時間戳記 | 根據日期時間和指定時區建立時間戳記。 |
格式化日期時間 | 將日期時間格式化為指定格式的字串。 |
將時間戳記轉換為日期時間 | 將時間戳記轉換為標準日期時間格式。 |
編碼器和解碼器
指令 | 說明 |
---|---|
解碼 | 將資料欄值解碼為 base32 、base64 或 hex. 其中之一 |
編碼 | 將資料欄值編碼為 base32 、base64 或 hex. 其中之一 |
雜湊處理和遮蓋
指令 | 說明 |
---|---|
雜湊 | 產生訊息摘要。 |
遮罩編號 | 對資料欄值套用替換遮罩。 |
遮罩隨機播放 | 對資料欄值套用亂數遮蓋。 |
查詢
指令 | 說明 |
---|---|
目錄查詢 | 對 ICD-9、ICD-10-2016 和 ICD-10-2017 代碼進行靜態目錄查詢。 |
資料表查詢 | 對資料表資料集執行查詢。 |
自然語言處理
指令 | 說明 |
---|---|
將詞彙轉換為符號 | 將 Porter 詞幹化演算法套用至英文單字。 |
輸出格式設定工具
指令 | 說明 |
---|---|
以 CSV 格式寫入 | 將記錄轉換為 CSV 格式。 |
以 JSON 對應方式寫入 | 將記錄轉換為 JSON 對應項目。 |
撰寫 JSON 物件 | 根據指定的欄位組合 JSON 物件。 |
採用貨幣格式 | 根據語言代碼指定的格式,將數字格式化為貨幣。 |
剖析器
指令 | 說明 |
---|---|
JSON 路徑 | 使用 DSL (JSON 路徑運算式) 剖析 JSON 記錄。 |
剖析為 AVRO 檔案 | 剖析 AVRO 資料檔案。 |
以 CSV 格式剖析 | 將輸入記錄解析為以半形逗號分隔的值 |
剖析為貨幣 | 將貨幣值解析為數字,該值是當地貨幣的字串表示法。 |
剖析為日期時間 | 使用指定格式,將字串解析為日期時間資料類型。 |
以 Excel 格式剖析 | 剖析成 Microsoft Excel 檔案。 |
剖析為固定長度 | 以指定寬度的固定長度記錄進行剖析。 |
以 HL7 格式剖析 | 剖析 Health Level 7 版本 2 (HL7 V2) 訊息。 |
剖析為 JSON | 剖析 JSON 物件。 |
以 Log 格式剖析 | 剖析存取記錄檔,例如 Apache httpd 和 NGINX 伺服器。 |
剖析為簡單日期 | 剖析日期字串。 |
剖析為時間戳記 | 剖析代表 Unix 時間戳記的資料欄值,並將其視為日期。 |
將 XML 剖析為 JSON | 將 XML 文件剖析為 JSON 結構。 |
資料列作業
指令 | 說明 |
---|---|
篩選資料列 | 依據條件篩選記錄。 |
Filter Row if Matched | 篩選符合資料欄模式的資料列。 |
Flatten | 分隔重複欄位中的元素。 |
因條件而失敗 | 當系統評估條件為 true 時,處理作業會失敗。 |
傳送至錯誤 | 將記錄篩選到錯誤收集器。 |
傳送至錯誤並繼續處理 | 將記錄篩選為錯誤收集器,並繼續處理。 |
分割為資料列 | 根據分隔符將資料分割為多個記錄。 |
轉換
指令 | 說明 |
---|---|
更換充電盒 | 將資料欄值的大小寫變更為大寫或小寫字元。 |
建立記錄 | 將值從來源資料欄複製到目的資料欄,藉此建立包含巢狀值的記錄資料欄。 |
剪下角色 | 選取字串值的部分。 |
設定資料欄 | 將資料欄值設為運算式執行結果。 |
尋找與取代 | 使用類似「sed」的運算式轉換字串欄值。 |
量化 | 將量化套用至欄值。 |
擷取規則運算式群組 | 將一組規則運算式的資料擷取到各自的資料欄。 |
設定字元集 | 設定編碼,然後將資料轉換為 UTF-8 字串。 |
設定記錄分隔符 | 設定記錄分隔符號。 |
電子郵件分割 | 將電子郵件 ID 拆分為帳戶和網域。 |
分割網址 | 將網址分割成各個組成部分。 |
文字距離 (模糊字串比對) | 測量兩個字元序列之間的差異。 |
文字指標 (模糊字串比對) | 測量兩個字元序列之間的差異。 |
網址解碼 | 從 application/x-www-form-urlencoded MIME 格式解碼。 |
網址編碼 | 以 application/x-www-form-urlencoded MIME 格式編碼。 |
修剪空格 | 用於修剪字串資料周圍空格的函式。 |
暫時匯總器和 setter
指令 | 說明 |
---|---|
增加變數 | 使用處理記錄遞增暫時性變數。 |
設定變數 | 設定含有處理記錄的暫時變數。 |
專屬 ID
指令 | 說明 |
---|---|
產生 UUID | 產生通用唯一識別碼 (UUID)。 |
後續步驟
- 進一步瞭解 Wrangler 函式。