En esta página, se explica cómo codificar y decodificar filas cuando preparas datos en el lugar de trabajo de Wrangler de Cloud Data Fusion Studio.
Cómo codificar una fila
Puedes usar la codificación de base de datos para almacenar o transferir datos en entornos que, por motivos heredados, están restringidos a datos US-ASCII. Puedes usarlo en aplicaciones nuevas sin esas restricciones heredadas, ya que permite la manipulación de objetos con editores de texto.
Puedes aplicar los siguientes esquemas de codificación, que se basan en la RFC-4648, a todos los valores de una columna:
- Base32
- Base64
- Hexadecimal
- URL
Cuando codificas, Wrangler genera una columna nueva con un nombre en el siguiente formato: <column>_encode_<type> except for url-encode
.
Cloud Data Fusion usa las siguientes reglas para los valores de columna:
- Si la columna es
null
, la columna resultante también esnull
. - Si no se encuentra la columna elegida en la fila, se omite.
- Si el valor de la columna no tiene un tipo de datos de cadena o byte, la transformación falla y se muestra un error.
Opciones de codificación compatibles
Wrangler admite las siguientes opciones de codificación:
- Codificación en base64
- La opción Base64 agrega la directiva
encode64
como un paso de transformación a la receta y crea una columna nueva con valores codificados. - Codifica en base32
- La opción Base32 agrega la directiva
encode32
como un paso de transformación a la receta y crea una columna nueva con valores codificados. - Codifica hexadecimal
- La opción Hex agrega la directiva
encode_hex
como un paso de transformación a la receta y crea una columna nueva con valores codificados. - Cómo codificar una URL
- La opción URL agrega la directiva
url-encode
como un paso de transformación a la receta y codifica la columna actual.
Cómo decodificar una fila
Puedes usar la decodificación básica de datos para almacenar o transferir datos en entornos que, por motivos heredados, están restringidos a datos US-ASCII. Puedes usarlo en aplicaciones nuevas sin esas restricciones heredadas, ya que permite la manipulación de objetos con editores de texto.
Puedes aplicar los siguientes esquemas de decodificación, que se basan en la RFC-4648, a cada valor de una columna:
- Base32
- Base64
- Hexadecimal
- URL
Cuando decodificas, Wrangler genera una columna nueva con un nombre en el siguiente
formato: <column>_encode_<type>
, excepto por url-decode
.
Cloud Data Fusion usa las siguientes reglas para los valores de columna:
- Si la columna es
null
, la columna resultante también esnull
. - Si no se encuentra la columna elegida en la fila, se omite.
- Si el valor de la columna no contiene los tipos de datos de cadena o array de bytes, la operación fallará.
Opciones de decodificación compatibles
Wrangler admite las siguientes opciones de codificación:
- Decodifica base64
- La opción base64 agrega la directiva
decode64
como un paso de transformación a la receta y crea una columna nueva con los valores decodificados. - Decodifica base32
- La opción base32 agrega la directiva
decode32
como un paso de transformación a la receta y crea una columna nueva con los valores decodificados. - Decodificar hexadecimal
- La opción Hex agrega la directiva
decode hex
como un paso de transformación a la receta y crea una columna nueva con los valores decodificados. - Cómo decodificar una URL
- La opción URL agrega la directiva
url-decode
como un paso de transformación a la receta y decodifica la columna actual.
¿Qué sigue?
- Obtén más información sobre las directivas de Wrangler.