FAQ Knowledge Catalog

Dokumen ini menjawab beberapa Pertanyaan Umum (FAQ) terkait Knowledge Catalog (sebelumnya Dataplex Universal Catalog).

Untuk mengetahui informasi selengkapnya tentang Knowledge Catalog, lihat Ringkasan Knowledge Catalog.

Apa itu Knowledge Catalog?

Google Knowledge Catalog adalah solusi tata kelola cerdas untuk aset data dan AI di Google Cloud. Layanan ini menyediakan inventaris terpusat tempat Anda dapat menemukan, mengelola, dan mengatur data di seluruh sumber data seperti BigQuery, Cloud Storage, Pub/Sub, dan Spanner. Google Cloud Teknologi ini menggunakan AI untuk mengotomatiskan penemuan data, pengayaan metadata, dan kualitas data. Melalui katalog data yang diatur, Knowledge Catalog memberikan dasar penting yang dibutuhkan agen AI untuk menghasilkan konten berkualitas tinggi.

Apa itu Katalog Data?

Data Catalog adalah nama asli layanan metadata Google Cloud. Seiring waktu, layanan ini berkembang menjadi Dataplex Universal Catalog, dan kini telah diganti namanya dan berkembang menjadi Knowledge Catalog.

Meskipun istilah "Katalog Data" masih digunakan untuk mendeskripsikan jenis pengindeksan data ini, dalam konteks Google Cloud, istilah tersebut merujuk pada produk lama kami. Sebaiknya semua project baru menggunakan Katalog Pengetahuan untuk memanfaatkan fitur yang didukung AI dan tata kelola yang ditingkatkan.

Apakah Knowledge Catalog berbeda dengan Data Catalog?

Ya, Knowledge Catalog adalah platform tata kelola data yang didukung AI yang pada akhirnya akan menggantikan Data Catalog yang ada. Meskipun memiliki konsep yang serupa, Knowledge Catalog memberikan beberapa peningkatan:

  • Konteks yang didukung AI: Tidak seperti Katalog Data, Katalog Pengetahuan menggunakan Gemini untuk mengekstrak konteks bisnis secara otomatis, membuat deskripsi dalam bahasa alami, dan menyediakan "kueri terbaik" SQL untuk memandu agen AI.

  • Dukungan metadata kaya: Knowledge Catalog mendukung jenis metadata yang lebih kompleks, seperti array, peta, dan catatan bertingkat.

  • Akses agen: Agen AI dapat menemukan dan menggunakan alat Katalog Pengetahuan secara adaptif melalui server MCP lokal atau jarak jauh.

  • Penemuan data: Knowledge Catalog dapat otomatis menyerap metadata dari serangkaian layanan dan sumber data eksternal yang lebih besar. Google Cloud

  • Tata kelola dalam skala besar: Dataplex menawarkan kemampuan yang ditingkatkan untuk pembuatan profil data, kualitas data otomatis, dan tata kelola terpusat.

Untuk apa Knowledge Catalog digunakan?

Google Knowledge Catalog memecahkan masalah "mulai dingin data"—waktu yang terbuang untuk mencoba menemukan, memahami, dan memercayai data sebelum Anda dapat benar-benar menggunakannya. Penggunaan utamanya mencakup:

  • Penemuan data yang dipercepat: Daripada menavigasi silo organisasi yang kompleks untuk menemukan data, Anda dapat menggunakan penelusuran bahasa alami (misalnya, "Tampilkan data churn pelanggan terbaru") untuk menemukan aset di seluruhGoogle Cloud sumber daya secara instan, sehingga meningkatkan produktivitas konsumen data.

  • Merujukkan agen AI: Bertindak sebagai "sumber tepercaya" untuk AI generatif atau ADK. Dengan menautkan data fisik ke definisi bisnis, dipastikan bahwa agen AI (seperti yang dibangun di Vertex AI) menggunakan data berkualitas tinggi, yang secara signifikan mengurangi halusinasi AI dan meningkatkan kepercayaan terhadap insight yang dihasilkan AI.

  • Tata kelola data otomatis: Secara otomatis memindai data Anda untuk mengidentifikasi informasi sensitif (seperti PII), melacak asal data (silsilah), dan memantau akurasinya (kualitas data otomatis). Kemampuan ini membantu meningkatkan kepercayaan data, keamanan, dan kepatuhan dengan upaya manual yang lebih sedikit.

  • Menemukan "data gelap": Layanan ini dapat memindai file tidak terstruktur (seperti PDF atau gambar di Cloud Storage), mengekstrak informasi di dalamnya, serta membuatnya dapat ditelusuri dan dikueri di BigQuery, yang membantu Anda mendapatkan insight dari data yang sebelumnya tidak dapat diakses.

Untuk kasus penggunaan langsung, lihat Menjelajahi Katalog Pengetahuan.

Jenis metadata apa yang disimpan Knowledge Catalog?

Knowledge Catalog menyimpan tiga jenis metadata:

  • Metadata teknis: Skema, nama tabel, dan properti sistem yang dikumpulkan secara otomatis.

  • Metadata bisnis: Konteks yang ditentukan pengguna seperti deskripsi bisnis, istilah glosarium, dan kepemilikan.

  • Metadata runtime: Informasi tentang silsilah data, skor kualitas data, dan statistik pembuatan profil data.

Bagaimana cara bermigrasi dari Data Catalog?

Transisi ke Knowledge Catalog dirancang agar lancar, tanpa memerlukan perpindahan data manual. Bergantung pada penggunaan Anda saat ini, prosesnya melibatkan dua fase utama:

  • Fase persiapan: Jika Anda memiliki metadata kustom (tag, template tag, atau entri kustom), konten ini akan otomatis dimasukkan ke dalam Knowledge Catalog sebagai hanya baca. Selama fase ini, Anda melakukan tugas konfigurasi untuk membuat konten Katalog Data yang ada tersedia secara bersamaan di antarmuka baru.

  • Fase transfer: Setelah disiapkan, Anda mentransfer status aktif metadata untuk menjadikannya dapat dibaca-tulis dalam Katalog Pengetahuan. Langkah ini harus dikoordinasikan dengan memperbarui beban kerja terprogram (API, library klien, atau modul Terraform) untuk mengarah ke endpoint Knowledge Catalog yang baru.

Jika tidak memiliki metadata kustom atau baru menggunakan platform ini, Anda dapat menyelesaikan transisi dengan menetapkan Katalog Pengetahuan sebagai pengalaman UI default di konsol Google Cloud .

Untuk mengetahui informasi selengkapnya, lihat Beralih dari Data Catalog ke Knowledge Catalog.