Auf dieser Seite werden die Direktiven beschrieben, die Sie in Wrangler verwenden können.
Im Power-Modus von Wrangler (Wrangler-Befehlszeile) können Sie einem Rezept Anweisungen und Funktionen hinzufügen. Weitere Informationen finden Sie unter Wrangler-Befehlszeilenrichtlinien und Wrangler-Funktionen.
Wrangler unterstützt die folgenden Anweisungen:
Spaltenvorgänge
Anweisung | Beschreibung |
---|---|
Groß-/Kleinschreibung von Spalten ändern | Ändert Spaltennamen in Groß- oder Kleinbuchstaben. |
Groß-/Kleinschreibung ändern | Ändert die Groß- und Kleinschreibung von Spaltenwerten. |
Spaltennamen bereinigen | Bereinigt Spaltennamen gemäß bestimmten Regeln. |
Spalten „Ersetzen“ | Ändert Spaltennamen im Bulk-Verfahren. |
Text | Kopiert Werte aus einer Quellspalte in eine Zielspalte. |
Spalte einfügen | Löscht eine Spalte in einem Datensatz. |
Null- oder leere Werte füllen | Wenn der Wert null oder leer ist, geben Sie einen festen Spaltenwert ein. |
Google Notizen | Behält die angegebenen Spalten des Datensatzes bei. |
Zusammenführen | Hiermit werden zwei Spalten durch Einfügen einer dritten Spalte zusammengeführt. |
Umbenennen | Benennt eine vorhandene Spalte im Datensatz um. |
Header festlegen | Legt die Namen der Spalten in der angegebenen Reihenfolge fest. |
In Spalten aufteilen | Eine Spalte anhand eines Trennzeichens in mehrere Spalten aufteilen |
Austauschen | Hiermit werden die Spaltennamen von zwei Spalten ausgetauscht. |
Settyp | Wandelt den Datentyp einer Spalte um. |
Datumstransformationen
Anweisung | Beschreibung |
---|---|
Diff. | Berechnet die Differenz zwischen zwei Datumsangaben. |
Datum formatieren | Benutzerdefinierte Muster für die Datums-/Uhrzeitformatierung. |
UNIX-Zeitstempel formatieren | Formatiert einen UNIX-Zeitstempel als Datum. |
Datums-/Uhrzeittransformationen
Anweisung | Beschreibung |
---|---|
Aktuelle Uhrzeit | Erzeugt die aktuelle Uhrzeit und das aktuelle Datum in einer bestimmten Zeitzone. |
Datum/Uhrzeit in Zeitstempel | Erstellt einen Zeitstempel aus einem Datetime-Wert und einer angegebenen Zeitzone. |
Datum/Uhrzeit formatieren | Formatiert „datetime“ in einen String mit einem bestimmten Format. |
Zeitstempel in „Datum und Uhrzeit“ | Wandelt einen Zeitstempel in Datum/Uhrzeit um. |
Encoder und Decoder
Anweisung | Beschreibung |
---|---|
Dekodieren | Entschlüsselt einen Spaltenwert als einen der Werte base32 , base64 oder hex. |
Codieren | Codiert einen Spaltenwert als einen der Werte base32 , base64 oder hex. . |
Hash-Technologie und Maskierung
Anweisung | Beschreibung |
---|---|
Hash | Erzeugt einen Nachrichten-Digest. |
Maskennummer | Wendet eine Substitutionsmaskierung auf die Spaltenwerte an. |
Maske | Wendet eine Zufallsmix-Maskierung auf die Spaltenwerte an. |
Suchanfragen
Anweisung | Beschreibung |
---|---|
Katalogsuche | Statische Katalogsuche nach ICD-9-, ICD-10-2016- und ICD-10-2017-Codes. |
Tabellenlookup | Führt Suchanfragen in Tabellendatasets aus. |
Natural Language Processing
Anweisung | Beschreibung |
---|---|
Stemming Tokenisierte Wörter | Der Porter-Stemming-Algorithmus wird auf englische Wörter angewendet. |
Ausgabeformate
Anweisung | Beschreibung |
---|---|
Als CSV-Datei schreiben | Wandelt einen Datensatz in das CSV-Format um. |
Als JSON-Zuordnung schreiben | Konvertiert den Datensatz in eine JSON-Map. |
JSON-Objekt schreiben | Erstellt ein JSON-Objekt anhand der angegebenen Felder. |
Als Währung formatieren | Formatiert eine Zahl als Währung gemäß der Spracheinstellung. |
Parser
Anweisung | Beschreibung |
---|---|
JSON-Pfad | Verwendet eine DSL (einen JSON-Pfadausdruck) zum Parsen von JSON-Einträgen. |
Als AVRO-Datei parsen | Parset eine AVRO-Datei. |
Als CSV-Datei parsen | Parset einen Eingabedatensatz als kommagetrennte Werte |
Als Währung analysieren | Parset einen Währungswert, der eine Stringdarstellung der Landeswährung ist, in eine Zahl. |
Als Datum/Uhrzeit parsen | Parset den String als Datum/Uhrzeit-Datentyp mit einem bestimmten Format. |
Als Excel-Datei parsen | Die Daten werden in eine Microsoft Excel-Datei geparst. |
Als feste Länge parsen | Wird als Datensatz mit fester Länge und angegebenen Breiten geparst. |
Als HL7 parsen | Hier werden Health Level 7 Version 2-Nachrichten (HL7 V2) geparst. |
Als JSON parsen | Parset ein JSON-Objekt. |
Als Protokoll analysieren | Parset Zugriffsprotokolldateien, z. B. von Apache httpd- und NGINX-Servern. |
Als einfaches Datum analysieren | Parset Datumsstrings. |
Als Zeitstempel parsen | Spaltenwerte, die einen Unix-Zeitstempel darstellen, werden als Datum geparst. |
XML in JSON parsen | Parset ein XML-Dokument in eine JSON-Struktur. |
Zeilenvorgänge
Anweisung | Beschreibung |
---|---|
Zeilen filtern | Filtert Einträge anhand einer Bedingung. |
Zeile filtern, wenn Übereinstimmung | Filtert Zeilen, die einem Muster für eine Spalte entsprechen. |
Flatten | Trennt die Elemente in einem wiederkehrenden Feld. |
Bei Bedingung fehlschlagen | Die Verarbeitung schlägt fehl, wenn die Bedingung als wahr ausgewertet wird. |
An Fehler senden | Filtert Einträge an einen Fehlersammler. |
An Fehler senden und Verarbeitung fortsetzen | Er filtert Einträge in einen Fehlersammler und fährt mit der Verarbeitung fort. |
In Zeilen unterteilen | Teilt anhand eines Trennzeichens in mehrere Datensätze auf. |
Transformationen
Anweisung | Beschreibung |
---|---|
Groß-/Kleinschreibung ändern | Ändert die Groß- und Kleinschreibung der Spaltenwerte. |
Datensatz erstellen | Erstellt eine Datensatzspalte mit verschachtelten Werten, indem Werte aus Quellspalten in eine Zielspalte kopiert werden. |
Zeichen ausschneiden | Wählt Teile eines Stringwerts aus. |
Spalte festlegen | Legt den Spaltenwert auf das Ergebnis der Ausführung eines Ausdrucks fest. |
Suchen und ersetzen | Transformiert Stringspaltenwerte mit einem sed-ähnlichen Ausdruck. |
Quantisierung | Wendet die Quantisierung auf Spaltenwerte an. |
Regex-Gruppen extrahieren | Extrahiert die Daten aus einer Gruppe von regulären Ausdrücken in eine eigene Spalte. |
Zeichensatz festlegen | Legt die Codierung fest und konvertiert die Daten dann in einen UTF-8-String. |
Set Record delimiter | Legt das Datensatztrennzeichen fest. |
E-Mail teilen | Eine E-Mail-ID wird in ein Konto und seine Domain unterteilt. |
URL teilen | Eine URL in ihre Bestandteile aufteilen. |
Textdistanz (ungefähre Stringübereinstimmung) | Misst den Unterschied zwischen zwei Zeichenfolgen. |
Textmesswert (ungenaue Stringübereinstimmung) | Misst den Unterschied zwischen zwei Zeichenfolgen. |
URL-Dekodierung | Dekodiert aus dem MIME-Format application/x-www-form-urlencoded . |
URL-Codierung | Codiert in das MIME-Format application/x-www-form-urlencoded . |
Gruppenbereiche zuschneiden | Funktionen zum Entfernen von Leerzeichen um Stringdaten herum |
Vorübergehende Aggregatoren und Festleger
Anweisung | Beschreibung |
---|---|
Inkrementvariable | Erhöht eine sitzungsspezifische Variable um einen Verarbeitungseintrag. |
Variable festlegen | Legt eine temporäre Variable mit einem Verarbeitungsprotokoll fest. |
Eindeutige ID
Anweisung | Beschreibung |
---|---|
UUID generieren | Generiert eine universell eindeutige Kennung (Universally Unique Identifier, UUID). |