Cette page décrit les directives que vous pouvez utiliser dans Wrangler.
En mode Power (mode Puissance) de Wrangler (CLI Wrangler), vous pouvez ajouter des directives et des fonctions à une recette. Pour en savoir plus, consultez les pages Directives de la CLI Wrangler et Fonctions Wrangler.
Wrangler est compatible avec les directives suivantes:
Opérations sur les colonnes
Directive | Description |
---|---|
Modifier la casse des colonnes | Convertit les noms de colonne en minuscules ou en majuscules. |
Modifier la casse | Modifie la casse des valeurs de colonne. |
Nettoyer les noms de colonnes | Nettoie les noms de colonnes, en suivant des règles spécifiques. |
Colonnes | Modifie les noms de colonnes de façon groupée. |
Copy | Copier les valeurs d'une colonne source dans une colonne de destination |
Colonne de dépôt | Supprime une colonne d'un enregistrement. |
Remplir les valeurs nulles ou vides | Si la valeur est nulle ou vide, une valeur de colonne fixe est saisie. |
Keep | Conserve les colonnes spécifiées de l'enregistrement. |
Fusionner | Fusionne deux colonnes en insérant une troisième colonne. |
Renommer | Renomme une colonne existante de l'enregistrement. |
Définir des en-têtes | Définit les noms des colonnes dans l'ordre où ils sont spécifiés. |
Diviser en colonnes | Fractionne une colonne en plusieurs colonnes en fonction d'un séparateur. |
Permuter | Interchange les noms de deux colonnes. |
Type de jeu | Convertit le type de données d'une colonne. |
Transformations de date
Directive | Description |
---|---|
Différence de date | Calcule la différence entre deux dates. |
Formater la date | Modèles personnalisés pour la mise en forme de la date et de l'heure. |
Formater un code temporel UNIX | Met en forme un code temporel UNIX sous forme de date. |
Transformations de date et d'heure
Directive | Description |
---|---|
Heure actuelle | Génère la date/heure actuelle avec un fuseau horaire donné. |
Date et heure en code temporel | Crée un code temporel à partir d'une date/heure et d'un fuseau horaire donné. |
Formater la date/heure | Met en forme la date et l'heure au format d'une chaîne donnée. |
Code temporel en date et heure | Convertit un code temporel en date et heure. |
Encodeurs et décodeurs
Directive | Description |
---|---|
Décodage | Décode une valeur de colonne en tant que base32 , base64 ou hex. . |
Encoder | Encode une valeur de colonne en tant que base32 , base64 ou hex. . |
Hachage et masquage
Directive | Description |
---|---|
Hachage | Génère un condensé du message. |
Numéro de masque | Applique le masquage par substitution aux valeurs de la colonne. |
Mélange des masques | Applique le masquage aléatoire aux valeurs de la colonne. |
Recherches
Directive | Description |
---|---|
Recherche dans le catalogue | Recherche statique dans le catalogue des codes ICD-9, ICD-10-2016 et ICD-10-2017. |
Recherche dans un tableau | Effectue des recherches dans les ensembles de données de table. |
Traitement du langage naturel
Directive | Description |
---|---|
Réduction des mots tokenisés | Applique l'algorithme de stemmer de Porter aux mots anglais. |
Outils de mise en forme de sortie
Directive | Description |
---|---|
Écrire au format CSV | Convertit un enregistrement au format CSV. |
Écrire en tant que carte JSON | Convertit l'enregistrement en carte JSON. |
Écrire un objet JSON | Compose un objet JSON en fonction des champs spécifiés. |
Format en devise | Formate un nombre en tant que devise, comme spécifié par les paramètres régionaux. |
Analyseurs
Directive | Description |
---|---|
Chemin d'accès JSON | Utilise un DSL (une expression de chemin JSON) pour analyser les enregistrements JSON. |
Analyser en tant que fichier AVRO | Analyse un fichier de données AVRO. |
Analyser au format CSV | Analyse un enregistrement d'entrée sous la forme de valeurs séparées par une virgule |
Analyser en tant que devise | Convertit une valeur de devise qui est une représentation de chaîne de la devise locale en nombre. |
Analyser en tant que date/heure | Analyse la chaîne en tant que type de données "date et heure" avec un format donné. |
Analyser en tant qu'Excel | Analyse dans un fichier Microsoft Excel. |
Analyser en tant que longueur fixe | Analyse en tant qu'enregistrement de longueur fixe avec des largeurs spécifiées. |
Analyser en tant que HL7 | Analyse les messages HL7 V2 (Health Level 7 Version 2). |
Analyser au format JSON | Analyse un objet JSON. |
Analyser en tant que journal | Analyse les fichiers de journaux d'accès, tels que les serveurs Apache httpd et NGINX. |
Analyser en tant que date simple | Analyse les chaînes de date. |
Analyser en tant que code temporel | Analyse les valeurs de colonne représentant un code temporel Unix sous forme de date. |
Analyser le fichier XML en JSON | Analyse un document XML dans une structure JSON. |
Opérations sur les lignes
Directive | Description |
---|---|
Filtrer les lignes | Filtre les enregistrements en fonction d'une condition. |
Filtrer la ligne si correspondance | Filtre les lignes qui correspondent à un modèle pour une colonne. |
Aplatir | Sépare les éléments d'un champ répété. |
Échec en cas de condition | Le traitement échoue lorsque la condition est évaluée à "true". |
Erreur d'envoi à | Filtre les enregistrements vers un collecteur d'erreurs. |
Envoyer à l'erreur et continuer le traitement | Filtre les enregistrements vers un collecteur d'erreurs et poursuit le traitement. |
Diviser en lignes | Scinde en plusieurs enregistrements en fonction d'un séparateur. |
Transformations
Directive | Description |
---|---|
Modifier la casse | Convertit les valeurs de la colonne en majuscules ou en minuscules. |
Créer un enregistrement | Crée une colonne d'enregistrements avec des valeurs imbriquées en copiant les valeurs des colonnes sources dans une colonne de destination. |
Caractère coupé | Sélectionne des parties d'une valeur de chaîne. |
Définir la colonne | Définit la valeur de la colonne sur le résultat de l'exécution d'une expression. |
Rechercher et remplacer | Transforme les valeurs de colonne de chaîne à l'aide d'une expression semblable à "sed". |
Quantification | Applique la quantification aux valeurs de la colonne. |
Extraire des groupes d'expressions régulières | Extrait les données d'un groupe d'expressions régulières dans sa propre colonne. |
Définir le jeu de caractères | Définit l'encodage, puis convertit les données en chaîne UTF-8. |
Définir la séparatrice d'enregistrement | Définit le délimiteur d'enregistrement. |
Diviser l'e-mail | Divisez une adresse e-mail en compte et en domaine. |
URL fractionnée | Divisez une URL en ses composants. |
Distance de texte (correspondance de chaîne floue) | Mesure la différence entre deux séquences de caractères. |
Métrique de texte (correspondance partielle de chaîne) | Mesure la différence entre deux séquences de caractères. |
Décodage d'URL | Décode à partir du format MIME application/x-www-form-urlencoded . |
Encodage d'URL | Encode au format MIME application/x-www-form-urlencoded . |
Couper les espaces | Fonctions permettant de couper les espaces blancs autour des données de chaîne. |
Agrégateurs et setters temporaires
Directive | Description |
---|---|
Variable d'incrément | Incrémente une variable temporaire avec un enregistrement de traitement. |
Définir une variable | Définit une variable temporaire avec un enregistrement du traitement. |
ID unique
Directive | Description |
---|---|
Générer un UUID | Génère un identifiant unique universel (UUID). |
Étape suivante
- En savoir plus sur les fonctions Wrangler