Namespace hierarkis adalah kemampuan yang ditawarkan oleh Cloud Storage yang memungkinkan Anda mengatur objek ke dalam folder dan menyimpan data dalam struktur sistem file logis, sehingga memudahkan Anda menyederhanakan tugas pengelolaan data. Namespace hierarkis menyediakan semantik direktori berperforma tinggi dan operasi folder atomik yang diperlukan untuk mempercepat workload analisis dan AI/ML yang intensif data.
Halaman ini memberikan ringkasan tentang namespace hierarkis dan kasus penggunaannya, termasuk kemampuan, manfaat, dan batasannya.
Cara kerjanya
Untuk menggunakan folder di bucket, Anda harus mengaktifkan namespace hierarkis saat membuat bucket. Setelan namespace hierarkis bucket tidak dapat diubah setelah bucket dibuat. Untuk mengetahui informasi tentang cara mengaktifkan namespace hierarkis untuk bucket, lihat Membuat dan mengelola bucket dengan namespace hierarkis diaktifkan.
Diagram berikut menunjukkan contoh bucket dengan namespace hierarkis diaktifkan tempat objek diatur dalam struktur hierarkis folder. Folder dalam bucket dengan namespace hierarkis diaktifkan dapat berisi objek dan folder turunan.
Kemampuan dan manfaat
Namespace hierarkis memberikan kemampuan dan manfaat berikut:
Kueri per detik (QPS) awal yang lebih tinggi: Bucket dengan namespace hierarkis diaktifkan menawarkan batas QPS awal hingga 8 kali lebih tinggi untuk membaca dan menulis objek dibandingkan dengan bucket tanpa namespace hierarkis diaktifkan. QPS awal yang lebih tinggi memudahkan penskalaan workload intensif data dan memberikan peningkatan throughput. Untuk mengetahui informasi tentang metode pengoptimalan performa saat menggunakan folder di bucket dengan namespace hierarkis diaktifkan, lihat Pengelolaan folder.
Kemampuan menggunakan folder: Folder berfungsi sebagai penampung objek dan folder turunan, sehingga memungkinkan struktur direktori yang sebenarnya dalam bucket Cloud Storage. Menyimpan data dalam struktur folder meningkatkan performa, memastikan konsistensi, dan menyederhanakan pengelolaan workload intensif data dan berorientasi file.
Operasi folder memberikan kemampuan pengelolaan dan keandalan, termasuk pembuatan, pencantuman, penghapusan, dan penggantian nama atomik.
Mengganti nama folder: Operasi ganti nama folder membantu Anda mengganti nama jalur folder dan folder yang mendasarinya secara atomik tanpa menghapus objek apa pun. Teknik ini efisien dan menghemat waktu, terutama untuk folder besar dengan beberapa objek.
Mencantumkan folder: Operasi cantumkan folder mencantumkan semua folder dalam bucket atau di bawah folder tertentu, sehingga membantu Anda mengelola dan memahami struktur data tersimpan.
Kapan Anda harus menggunakan namespace hierarkis?
Anda harus mempertimbangkan untuk mengaktifkan namespace hierarkis saat menggunakan aplikasi yang mengharapkan hierarki dan semantik sistem file. Namespace hierarkis bermanfaat untuk tugas intensif data seperti workload analisis dan AI/ML. Berikut beberapa skenario umum saat Anda harus mempertimbangkan penggunaan namespace hierarkis:
Pemrosesan berbasis Hadoop: Workload Hadoop dan Spark secara tradisional mengharapkan struktur penyimpanan sistem file dan penamaan berbasis waktu untuk file dan folder. Namespace hierarkis terintegrasi dengan konektor Cloud Storage untuk memberikan peningkatan throughput dan penggantian nama folder atomik, sehingga meningkatkan integritas dan konsistensi data untuk banyak pipeline pemrosesan data.
Pemrosesan workload berorientasi file: Workload seperti pemrosesan analisis batch, layanan keuangan, atau komputasi berperforma tinggi disusun ke dalam partisi berdasarkan hierarki folder dan file. Namespace hierarkis membantu mengelola lingkungan ini dengan API khusus untuk pengelolaan folder. Selain itu, namespace hierarkis menyederhanakan pengelolaan folder yang berisi folder dan objek lainnya. Dengan satu perintah API, Anda dapat dengan cepat mengganti nama folder beserta semua kontennya, sehingga menghemat waktu dan resource yang berharga.
Pemrosesan AI/ML: Alat AI/ML seperti TensorFlow, Pandas, dan PyTorch mengharapkan kontrol akses dan semantik sistem file. Namespace hierarkis, terutama jika dikombinasikan dengan Cloud Storage FUSE, memberikan peningkatan throughput dan akses data yang efisien. Alhasil, namespace hierarkis meningkatkan performa dan keandalan iterasi model ML.
Sebelum mengaktifkan namespace hierarkis untuk bucket, Anda harus mempertimbangkan batasan namespace hierarkis. Untuk mengetahui informasi tentang batasan namespace hierarkis, lihat Batasan.
Manfaat namespace hierarkis
Saat mengaktifkan namespace Hierarkis untuk bucket, Anda dapat melakukan hal berikut:
Mengoptimalkan organisasi: Anda dapat mengatur data ke dalam struktur folder hierarkis, yang membantu Anda mengelola dan menemukan file atau set data.
Membuat ekosistem sistem file: Namespace hierarkis memperkenalkan fitur sistem file seperti folder, penggantian nama folder, dan pencantuman folder, yang bermanfaat untuk aplikasi berorientasi file, termasuk ekosistem Hadoop dan workload AI/ML.
Peningkatan performa: Dengan menskalakan workload intensif data untuk menangani throughput yang lebih tinggi, Anda dapat meningkatkan performa aplikasi secara keseluruhan.
Dukungan platform
Bucket dengan namespace hierarkis mendukung kemampuan platform Cloud Storage berikut:
Semua API objek Cloud Storage dan fitur Cloud Storage yang banyak digunakan. Untuk mengetahui detail tentang fitur yang tidak didukung, lihat Batasan.
Transfer data dari bucket standar ke bucket dengan namespace hierarkis menggunakan Storage Transfer Service.
Integrasi dengan produk berikut:
Konektor Cloud Storage, yang dikelola oleh Managed Service untuk Apache Spark untuk workload Hadoop. Untuk mengetahui informasi selengkapnya, lihat Menggunakan bucket dengan namespace hierarkis diaktifkan untuk workload Hadoop.
Cloud Storage FUSE untuk akses bucket seperti sistem file menggunakan klien.
Kompatibilitas dengan operasi dan fitur Cloud Storage
Bucket dengan namespace hierarkis diaktifkan berinteraksi dengan operasi Cloud Storage secara berbeda dengan bucket tanpa namespace hierarkis.
Interaksi dengan operasi objek
Bucket dengan namespace hierarkis diaktifkan menangani objek operasi dengan cara berikut:
- Operasi seperti
Upload,Rewrite, danComposesecara otomatis membuat folder induk yang tidak ada, selama Anda memiliki izin yang diperlukan. Alhasil, Anda tidak perlu membuat folder terlebih dahulu sebelum mengupload objek. - Meskipun folder dapat dibuat secara otomatis selama operasi objek, Anda
harus menghapusnya secara eksplisit menggunakan operasi
DeleteFolder. - Saat menggunakan operasi
ListObjectsdengan parameterdelimiter, bucket akan menampilkan setiap folder turunan sebagaiprefix.Namun, folder kosong akan dikecualikan secara default. Untuk menyertakan folder kosong, mirip dengan listingan sistem file biasa, Anda harus menetapkan parameterincludeFoldersAsPrefixes. Untuk mengetahui informasi tentang metode pengoptimalan performa saat mencantumkan objek di bucket dengan namespace hierarkis diaktifkan, lihat Mencantumkan objek.
Interaksi dengan operasi bucket
Bagian berikut menjelaskan cara operasi bucket ditangani saat namespace hierarkis diaktifkan.
Anda dapat mencantumkan semua bucket dengan namespace hierarkis diaktifkan, terlepas dari tata letak penyimpanannya. Tata letak penyimpanan bucket menjelaskan cara objek diatur dalam bucket, baik dalam namespace datar maupun namespace hierarkis. Untuk mengetahui petunjuk tentang cara melihat tata letak penyimpanan bucket, lihat Mendapatkan tata letak penyimpanan bucket. Untuk mencantumkan semua bucket, ikuti petunjuk yang dijelaskan dalam Mencantumkan bucket.
Anda dapat menghapus bucket dengan namespace hierarkis diaktifkan selama bucket kosong. Bucket kosong tidak berisi objek atau folder terkelola. Bucket kosong dapat berisi folder kosong (tanpa objek di dalamnya).
Interaksi dengan operasi Object Lifecycle Management
Object Lifecycle Management memungkinkan Anda mengotomatiskan tindakan pada objek
berdasarkan kondisi, seperti usia atau awalan. Namun, aturan Object Lifecycle Management dapat berperilaku berbeda di bucket dengan namespace hierarkis dan di bucket dengan namespace datar karena operasi RenameFolder:
Aturan Object Lifecycle Management untuk bucket dengan namespace datar: Operasi penggantian nama melibatkan penggantian nama setiap objek menggunakan alat dengan menyalin setiap objek ke lokasi tujuan dan menghapus objek asli dari lokasi sumber. Alhasil, objek baru dibuat dengan waktu pembuatan baru di lokasi tujuan. Jika aturan Object Lifecycle Management berbasis usia diterapkan untuk lokasi tujuan, aturan tersebut tidak akan langsung berlaku untuk objek baru karena waktu pembuatannya direset.
Aturan Object Lifecycle Management untuk bucket dengan namespace hierarkis diaktifkan: Penggantian nama folder beroperasi di tingkat folder, tanpa harus mengganti nama setiap objek. Alhasil, waktu pembuatan objek dipertahankan, yang berarti aturan Object Lifecycle Management berbasis usia langsung diterapkan ke objek yang diganti namanya jika memenuhi kriteria usia.
Kontrol akses untuk folder dengan folder terkelola terkait
Di Cloud Storage, folder adalah direktori sebenarnya yang menyimpan data Anda, sedangkan folder terkelola adalah resource khusus yang terpisah dan digunakan untuk menerapkan izin IAM ke direktori. Untuk mengontrol akses ke folder dan resource di dalamnya, Anda membuat folder terkelola terkait dan menetapkan kebijakan IAM pada folder terkelola terkait. Folder terkelola terkait adalah folder terkelola yang memiliki nama dan jalur yang sama dengan folder sebenarnya.
Folder terkelola terkait bertindak sebagai lapisan administratif di atas direktori yang dibuat oleh folder, yang berarti bahwa folder dan folder terkelola terkait terhubung secara tidak terpisahkan. Misalnya, jika Anda menghapus folder yang memiliki folder terkelola terkait, folder terkelola terkait juga akan dihapus bersama dengan kebijakan IAM-nya. Untuk mengetahui detail tentang pengaruh operasi folder terhadap folder terkelola terkait, lihat Interaksi antara folder dan folder terkelola terkait.
Penamaan untuk folder dengan folder terkelola terkait
Aturan penamaan folder dan aturan penamaan folder terkelola berlaku saat membuat folder dengan folder terkelola terkait. Nama folder dapat disusun bertingkat hingga 50 tingkat, tetapi nama folder terkelola hanya dapat disusun bertingkat hingga 15 tingkat. Ukuran maksimum untuk nama folder terkelola adalah 512 byte saat dienkode UTF-8. Artinya, jika Anda berencana membuat folder dan folder terkelola terkait untuk folder tersebut, folder hanya dapat memiliki 15 folder turunan bertumpuk, dan ukuran nama maksimumnya adalah 512 byte saat dienkode UTF-8.
Harga
Untuk mengetahui informasi harga, lihat Harga Cloud Storage.
Batasan
Berikut adalah batasan namespace hierarkis:
Anda harus memilih apakah akan menggunakan namespace hierarkis atau tidak saat membuat bucket; setelan namespace hierarkis bucket tidak dapat diubah setelah bucket dibuat.
Untuk mengaktifkan namespace hierarkis, bucket juga harus mengaktifkan akses level bucket yang seragam.
Kemampuan Cloud Storage berikut tidak didukung untuk bucket yang menggunakan namespace hierarkis:
- Kunci Bucket
- Relokasi bucket
- Replikasi lintas bucket
- Penangguhan objek
- Kunci Retensi Objek
- Pembuatan Versi Objek
Langkah berikutnya
- Membuat bucket dengan namespace hierarkis diaktifkan.
- Membuat dan mengelola folder.
- Mengganti nama folder.
- Menggunakan namespace hierarkis untuk workload Hadoop.
- Mengoptimalkan performa.
Coba sendiri
Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa Cloud Storage dalam skenario dunia nyata. Pelanggan baru juga akan mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
Coba Cloud Storage gratis