Questa pagina spiega come codificare e decodificare le righe quando prepari i dati nello spazio di lavoro Wrangler di Cloud Data Fusion Studio.
Codificare una riga
Puoi utilizzare la codifica di base dei dati per archiviare o trasferire dati in ambienti che, per motivi di compatibilità con le versioni precedenti, sono limitati ai dati US-ASCII. Potresti utilizzarlo nelle nuove applicazioni senza queste limitazioni precedenti perché consente la manipolazione degli oggetti con gli editor di testo.
Puoi applicare i seguenti schemi di codifica, basati su RFC-4648, a tutti i valori di una colonna:
- Base32
- Base64
- Esadecimale
- URL
Quando esegui la codifica, Wrangler genera una nuova colonna con un nome nel seguente
formato: <column>_encode_<type> except for url-encode.
Cloud Data Fusion utilizza le seguenti regole per i valori delle colonne:
- Se la colonna è
null, anche la colonna risultante ènull. - Se la colonna scelta non viene trovata nella riga, la riga viene saltata.
- Se il valore della colonna non ha un tipo di dati di stringa o byte, la trasformazione non va a buon fine e viene visualizzato un errore.
Opzioni di codifica supportate
Wrangler supporta le seguenti opzioni di codifica:
- Codifica base64
- L'opzione Base64 aggiunge la direttiva
encode64come passaggio di trasformazione alla ricetta e crea una nuova colonna con i valori codificati. - Codifica base32
- L'opzione Base32 aggiunge la direttiva
encode32come passaggio di trasformazione alla ricetta e crea una nuova colonna con i valori codificati. - Codifica esadecimale
- L'opzione Esadecimale aggiunge la direttiva
encode_hexcome passaggio di trasformazione alla ricetta e crea una nuova colonna con i valori codificati. - Codifica URL
- L'opzione URL aggiunge la direttiva
url-encodecome passaggio di trasformazione alla ricetta e codifica la colonna corrente.
Decodificare una riga
Puoi utilizzare la decodifica di base dei dati per archiviare o trasferire dati in ambienti che, per motivi di compatibilità con le versioni precedenti, sono limitati ai dati US-ASCII. Potresti utilizzarlo nelle nuove applicazioni senza queste limitazioni precedenti perché consente la manipolazione degli oggetti con gli editor di testo.
Puoi applicare i seguenti schemi di decodifica, basati su RFC-4648, a ciascun valore di una colonna:
- Base32
- Base64
- Esadecimale
- URL
Durante la decodifica, Wrangler genera una nuova colonna con un nome nel seguente formato: <column>_encode_<type>, ad eccezione di url-decode.
Cloud Data Fusion utilizza le seguenti regole per i valori delle colonne:
- Se la colonna è
null, anche la colonna risultante ènull. - Se la colonna scelta non viene trovata nella riga, la riga viene saltata.
- Se il valore della colonna non contiene i tipi di dati stringa o array di byte, l'operazione non va a buon fine.
Opzioni di decodifica supportate
Wrangler supporta le seguenti opzioni di codifica:
- Decodifica base64
- L'opzione base64 aggiunge la direttiva
decode64come passaggio di trasformazione alla ricetta e crea una nuova colonna con i valori decodificati. - Decodifica base32
- L'opzione base32 aggiunge la direttiva
decode32come passaggio di trasformazione alla ricetta e crea una nuova colonna con i valori decodificati. - Decodifica esadecimale
- L'opzione Hex aggiunge la direttiva
decode hexcome passaggio di trasformazione alla ricetta e crea una nuova colonna con i valori decodificati. - Decodifica URL
- L'opzione URL aggiunge la direttiva
url-decodecome passaggio di trasformazione alla ricetta e decodifica la colonna corrente.
Passaggi successivi
- Scopri di più sulle istruzioni di Wrangler.