Dalam skenario ini, Anda mengelola database yang menyimpan catatan tentang cara penggunaan berbagai layanan yang disediakan oleh penyedia layanan kesehatan. Agar data lebih mudah digunakan, Anda dapat menjelajahi tabel untuk mengidentifikasi potensi perubahan. Sebelum menerapkan perubahan, Anda mengidentifikasi apakah ada peningkatan yang memengaruhi alur kerja yang ada dan apakah penyesuaian tambahan diperlukan.
Dalam tutorial ini, gunakan silsilah data untuk mengidentifikasi pengaruh transformasi data terhadap resource hilir dan alur kerja yang menjadi bagian dari resource tersebut.
Mulai
Untuk menyelesaikan kasus penggunaan, siapkan lingkungan terlebih dahulu dan jalankan transformasi data. Gunakan halaman prasyarat dan penyiapan untuk menghubungkan repositori jarak jauh ke Dataform. Repositori ini berisi kode yang diperlukan untuk menyiapkan set data dan mentransformasi data.
Setelah Anda menyelesaikan penyiapan lingkungan, gunakan BigQuery dan Lineage Explorer untuk melacak transformasi data dan pengaruhnya terhadap alur kerja.
Menganalisis transformasi data dengan Lineage Explorer
Setelah menyiapkan set data, analisis dampak transformasi data menggunakan tab Silsilah BigQuery.
Memverifikasi integritas data
Dalam contoh ini, periksa kolom medicare_participation_indicator yang menunjukkan apakah dokter atau pemasok setuju untuk memberikan layanan untuk Medicare. Grafik silsilah menunjukkan bagaimana transformasi data di antara tabel turunan menghasilkan perubahan jenis data kolom:
- Di konsol Google Cloud , buka halaman BigQuery.
- Gunakan kolom penelusuran untuk menemukan tabel
physicians_and_other_supplier_2012_original. - Klik tab Silsilah.
- Di panel Lineage Explorer, lakukan hal berikut:
- Di bagian Column Level Lineage, pilih nama kolom
medicare_participation_indicatordari daftar. - Di bagian Direction, pilih arah Downstream.
- Klik Terapkan.
- Di bagian Column Level Lineage, pilih nama kolom
- Perluas jalur silsilah hingga Anda mencapai
vertex_ai_model_final_features. Menganalisis perubahan jalur antara tabel
supplier_stg3dan tabelsupplier_transform1:
Visualisasi pelacakan asal untuk kolom medicare_participation_indicator- Penanda jalur Salinan Persis menunjukkan bahwa kolom diteruskan tanpa perubahan.
- Penandaan jalur Lainnya menunjukkan transformasi. Dalam jalur ini, jenis data
Stringdiperlakukan sepertiBoolean.
Jalur menunjukkan bahwa jenis data kolom berubah, yang mungkin memerlukan penyesuaian dalam alur kerja yang menggunakan tabel ini.
Mengidentifikasi kolom yang berlebihan
Contoh ini memeriksa kolom nppes_credentials yang mencantumkan ID Penyedia Nasional yang dimiliki praktisi dalam National Plan and Provider Enumeration System (NPPES):
- Di konsol Google Cloud , buka halaman BigQuery.
- Gunakan kolom penelusuran untuk menemukan tabel
physicians_and_other_supplier_2012_original. - Klik tab Silsilah.
- Di panel Lineage Explorer, lakukan hal berikut:
- Di bagian Column Level Lineage, pilih nama kolom
nppes_credentialsdari daftar. - Di bagian Direction, pilih arah Downstream.
- Klik Terapkan.
- Di bagian Column Level Lineage, pilih nama kolom
- Perluas jalur untuk memeriksa apakah ada silsilah hilir yang mengarah ke
vertex_ai_model_final_features.
Tidak ada silsilah berarti kolom ini mungkin tidak relevan dalam alur kerja tertentu ini, dan bahkan dapat dihapus.
Untuk mengetahui informasi selengkapnya tentang memvisualisasikan data dengan grafik silsilah data, lihat Tampilan grafik silsilah.