Dataplex Universal Catalog adalah solusi tata kelola data cerdas dan terpadu yang membantu Anda mengelola, memahami, dan menggunakan aset data di organisasi Anda. Dengan menggunakan AI, Dataplex Universal Catalog menyederhanakan pekerjaan dengan data yang didistribusikan di berbagai sistem, sehingga Anda dapat berfokus untuk mendapatkan insight yang berharga.
Misalnya, pertimbangkan perusahaan retail global yang menghasilkan data penjualan, inventaris, dan pelanggan dalam jumlah besar, lalu menyimpannya di Cloud Storage, Spanner, dan Pub/Sub. Jika data didistribusikan di seluruh sistem dengan cara ini, pengelolaan tata kelola, memastikan kualitas, dan mempertahankan kepatuhan dapat menjadi rumit dan memakan waktu. Dataplex Universal Catalog menyederhanakan pelaksanaan proses ini dengan menyediakan katalog data pusat untuk menemukan, membuat profil, memvalidasi, melacak silsilah, dan mengontrol akses ke aset data organisasi.
Dokumen ini menjelaskan fitur inti Katalog Universal Dataplex dan menyoroti kasus penggunaan utama.
Fitur Dataplex Universal Catalog
Dataplex Universal Catalog mengatur data melalui fitur berikut:
- Pembuatan katalog metadata. Mengambil metadata untuk resource (di BigQuery, Cloud SQL, Spanner, Vertex AI, Pub/Sub, Dataform, Dataproc Metastore), dan resource pihak ketiga yang Anda masukkan ke Katalog Universal Dataplex, untuk katalog data instan. Google Cloud
- Penemuan data. Memindai data terstruktur dan tidak terstruktur di bucket Cloud Storage untuk mengekstrak dan membuat katalog metadatanya.
- Insight data. Gunakan AI untuk membuat pertanyaan bahasa alami tentang data Anda, untuk mengungkap pola, menilai kualitas data, dan melakukan analisis statistik.
- Pembuatan profil data. Identifikasi karakteristik umum data kolom dalam tabel BigQuery Anda, misalnya, nilai data umum, distribusi data, dan jumlah nilai null, yang dapat menginformasikan klasifikasi data dan penjaminan kualitas.
- Kualitas data. Tentukan dan ukur kualitas data dalam tabel BigQuery Anda, dengan memvalidasi data terhadap kebijakan organisasi dan mencatat pemberitahuan jika data tidak memenuhi kriteria kualitas.
- Glosarium bisnis. Kelola terminologi dan definisi terkait bisnis di seluruh organisasi Anda, dan lampirkan istilah ke kolom tabel untuk meningkatkan pemahaman yang konsisten tentang penggunaan data.
- Silsilah data. Lacak cara data berpindah melalui sistem Anda: dari mana data berasal, ke mana data diteruskan, dan transformasi apa yang diterapkan pada data.
Dataplex Universal Catalog mendukung siklus proses data secara menyeluruh, mulai dari penemuan terdistribusi hingga insight bisnis. Fitur tata kelola juga tersedia melalui BigQuery.
Kasus penggunaan
Anda dapat menggunakan Katalog Universal Dataplex untuk melakukan hal berikut:
Menemukan dan memahami data Anda. Dataplex Universal Catalog memberikan visibilitas atas resource data Anda di seluruh organisasi. Dengan begitu, Anda dapat menemukan resource yang relevan untuk kebutuhan konsumsi data. Memberikan konteks untuk sumber data, yang membantu Anda memahami kesesuaian sumber data dengan kebutuhan konsumen data Anda.
Aktifkan tata kelola data dan pengelolaan data. Dataplex Universal Catalog menyediakan metadata yang dapat menginformasikan dan mendukung kemampuan tata kelola dan pengelolaan data Anda.
Buat katalog data terpusat. Dataplex Universal Catalog menyimpan dan menyediakan akses ke metadata yang dikumpulkan secara otomatis dari resource Anda. Google Cloud Anda dapat mengintegrasikan metadata Anda sendiri dari sistem non-Google Cloud . Anda dapat memperkaya semua metadata dengan anotasi metadata bisnis dan teknis tambahan.
Mulai
Jika ini pertama kalinya Anda menggunakan Dataplex Universal Catalog, sebaiknya ikuti panduan memulai cepat:
Langkah berikutnya
- Pelajari pengelolaan metadata di Dataplex Universal Catalog.
- Pelajari cara menelusuri aset data.
- Pelajari cara mengelola entri dan menyerap sumber kustom.
- Pelajari cara mengimpor metadata ke Dataplex Universal Catalog.
- Pelajari tata kelola BigQuery.