Namespace hierarkis adalah kemampuan yang ditawarkan oleh Cloud Storage yang memungkinkan Anda mengatur objek ke dalam folder dan menyimpan data dalam struktur sistem file yang logis, sehingga mempermudah penyederhanaan tugas pengelolaan data. Namespace hierarkis menyediakan semantik direktori berperforma tinggi dan operasi folder atomik yang diperlukan untuk mempercepat workload AI/ML dan analisis yang memproses banyak data.
Halaman ini memberikan ringkasan tentang ruang nama hierarkis, termasuk fitur utama, kasus penggunaan umum, manfaat, dan batasannya.
Cara kerjanya
Untuk menggunakan folder dalam bucket, Anda harus mengaktifkan ruang nama hierarkis saat membuat bucket. Setelan namespace hierarkis bucket Anda tidak dapat diubah setelah bucket dibuat. Untuk mengetahui informasi tentang cara mengaktifkan namespace hierarkis untuk bucket Anda, lihat Membuat dan mengelola bucket dengan namespace hierarkis yang diaktifkan.
Diagram berikut menunjukkan contoh bucket dengan namespace hierarkis yang diaktifkan, tempat objek disusun dalam struktur hierarkis folder. Folder dalam bucket dengan namespace hierarkis yang diaktifkan dapat berisi objek dan folder turunan.
Fitur utama
Namespace hierarkis menyediakan fitur berikut:
Kueri per detik (QPS) awal yang lebih tinggi: Bucket dengan namespace hierarkis yang diaktifkan menawarkan batas QPS awal hingga 8 kali lebih tinggi untuk membaca dan menulis objek dibandingkan dengan bucket tanpa namespace hierarkis yang diaktifkan. QPS awal yang lebih tinggi mempermudah penskalaan beban kerja yang intensif data dan memberikan throughput yang lebih baik. Untuk informasi tentang metode pengoptimalan performa saat menggunakan folder di bucket dengan namespace hierarkis diaktifkan, lihat Pengelolaan folder.
Folder: Folder berfungsi sebagai penampung untuk objek dan folder lainnya, dengan dukungan untuk operasi seperti membuat, menghapus, dan mendapatkan folder. Menyimpan data dalam struktur folder akan meningkatkan performa, memastikan konsistensi, dan menyederhanakan pengelolaan workload yang intensif data dan berorientasi file.
Operasi folder: Operasi folder memberikan kemampuan pengelolaan dan keandalan, termasuk membuat, menghapus, mencantumkan, dan mengganti nama folder.
Mengganti nama folder: Operasi penggantian nama folder membantu Anda mengganti nama jalur folder dan folder dasarnya secara atomik tanpa menghapus objek apa pun. Teknik ini efisien dan menghemat waktu, terutama untuk folder besar dengan beberapa objek.
Mencantumkan folder: Operasi mencantumkan folder mencantumkan semua folder dalam bucket atau di bawah folder tertentu, sehingga membantu Anda mengelola dan memahami struktur data yang disimpan.
Kapan Anda harus menggunakan ruang nama hierarkis?
Anda harus mempertimbangkan untuk mengaktifkan namespace hierarkis saat bekerja dengan aplikasi yang mengharapkan hierarki dan semantik sistem file. Ruang nama hierarkis bermanfaat untuk tugas intensif data seperti analisis dan workload AI/ML. Berikut beberapa skenario umum yang mengharuskan Anda mempertimbangkan penggunaan namespace hierarkis:
Pemrosesan berbasis Hadoop: Workload Hadoop dan Spark biasanya mengharapkan struktur penyimpanan sistem file dan penamaan berbasis waktu untuk file dan folder. Namespace hierarkis terintegrasi dengan konektor Cloud Storage untuk memberikan throughput yang lebih baik dan penggantian nama folder atomik, sehingga meningkatkan integritas dan konsistensi data untuk banyak pipeline pemrosesan data.
Pemrosesan workload berorientasi file: Workload seperti pemrosesan analisis batch, layanan keuangan, atau komputasi berperforma tinggi disusun ke dalam partisi berdasarkan hierarki folder dan file. Namespace hierarkis membantu mengelola lingkungan ini dengan API khusus untuk pengelolaan folder. Selain itu, namespace hierarkis menyederhanakan pengelolaan folder yang berisi folder dan objek lain. Dengan satu perintah API, Anda dapat mengganti nama folder beserta semua isinya dengan cepat, sehingga menghemat waktu dan sumber daya yang berharga.
Pemrosesan AI/ML: Alat AI/ML seperti TensorFlow, Pandas, dan PyTorch memerlukan kontrol akses dan semantik sistem file. Namespace hierarkis, terutama jika dikombinasikan dengan Cloud Storage FUSE, memberikan peningkatan throughput dan akses data yang efisien. Hasilnya, ruang nama hierarkis meningkatkan performa dan keandalan iterasi model ML.
Sebelum mengaktifkan namespace hierarkis untuk bucket, Anda harus mempertimbangkan batasan namespace hierarkis. Untuk mengetahui informasi tentang batasan namespace hierarkis, lihat Batasan.
Manfaat namespace hierarkis
Saat mengaktifkan Namespace hierarkis untuk bucket, Anda dapat melakukan hal berikut:
Mengoptimalkan organisasi: Anda dapat mengatur data ke dalam struktur folder hierarkis yang membantu Anda mengelola dan menemukan file atau set data.
Membangun ekosistem sistem file: Ruang nama hierarkis memperkenalkan fitur sistem file seperti folder, penggantian nama folder, dan listingan folder, yang bermanfaat untuk aplikasi berorientasi file, termasuk ekosistem Hadoop dan workload AI/ML.
Peningkatan performa: Dengan menskalakan workload yang intensif data untuk menangani throughput yang lebih tinggi, Anda dapat meningkatkan performa aplikasi secara keseluruhan.
Dukungan platform
Bucket dengan namespace hierarkis mendukung kemampuan platform Cloud Storage berikut:
Semua API objek Cloud Storage dan fitur Cloud Storage yang banyak digunakan. Untuk mengetahui detail tentang fitur yang tidak didukung, lihat Batasan.
Transfer data dari bucket standar ke bucket dengan namespace hierarkis menggunakan Storage Transfer Service.
Integrasi dengan produk berikut:
Konektor Cloud Storage, yang dikelola oleh Dataproc untuk workload Hadoop. Untuk mengetahui informasi selengkapnya, lihat Menggunakan bucket yang mendukung namespace hierarkis untuk workload Hadoop.
Cloud Storage FUSE untuk akses bucket seperti sistem file menggunakan klien.
Kompatibilitas dengan operasi dan fitur Cloud Storage
Bucket dengan namespace hierarkis yang diaktifkan memiliki interaksi berikut dengan operasi Cloud Storage lainnya:
Cara operasi objek ditangani
Bucket dengan namespace hierarkis yang diaktifkan menangani operasi objek dengan cara berikut:
- Operasi seperti
Upload,Rewrite, danComposeakan otomatis membuat folder induk yang belum ada, selama Anda memiliki izin yang diperlukan. Oleh karena itu, Anda tidak perlu membuat folder terlebih dahulu sebelum mengupload objek. - Meskipun folder dapat dibuat secara otomatis selama operasi objek, Anda
harus menghapusnya secara eksplisit menggunakan operasi
DeleteFolder. - Saat menggunakan operasi
ListObjectsdengan parameterdelimiter, bucket menampilkan setiap folder turunan sebagaiprefix.Namun, folder kosong dikecualikan secara default. Untuk menyertakan folder kosong, mirip dengan listingan sistem file umum, Anda harus menetapkan parameterincludeFoldersAsPrefixes. Untuk informasi tentang metode pengoptimalan performa saat mencantumkan objek dalam bucket dengan namespace hierarkis yang diaktifkan, lihat Mencantumkan objek.
Cara folder terkelola ditangani
Bucket dengan namespace hierarkis yang diaktifkan menawarkan kontrol akses terperinci saat digunakan dengan folder terkelola. Di bucket dengan namespace hierarkis yang diaktifkan, folder adalah direktori sebenarnya yang menyimpan data Anda, sedangkan folder terkelola adalah resource khusus yang digunakan untuk menerapkan izin IAM terperinci ke direktori tersebut. Untuk mengelola akses ke folder, Anda harus membuat folder terkelola dengan nama yang sama seperti folder, lalu menerapkan kebijakan IAM ke folder tersebut.
Folder terkelola ditangani dengan cara berikut di bucket dengan namespace hierarkis diaktifkan.
- Membuat folder terkelola akan otomatis membuat folder induk yang belum ada, termasuk folder dengan nama yang sama. Misalnya, Anda memiliki bucket kosong dengan namespace hierarkis yang diaktifkan bernama
example-ai-datasets. Jika Anda membuat folder terkelola dalamexample-ai-datasetsyang disebut2025/training-data/, Cloud Storage akan otomatis membuat folder induk2025/dan folder targettraining-data/. - Folder terkelola tidak dapat ada tanpa folder terkait.
- Menghapus folder akan otomatis menghapus folder terkelola terkait.
- Mengganti nama folder akan otomatis mengganti nama folder terkelola terkait.
- Bucket dengan namespace hierarkis harus mengikuti aturan penamaan folder terkelola dan aturan penamaan folder. Meskipun nama folder dapat disusun bertingkat hingga 50 tingkat, nama folder terkelola hanya dapat disusun bertingkat hingga 15 tingkat. Ukuran nama folder terkelola maksimum dibatasi oleh ukuran nama folder maksimum, yaitu 512 byte saat dienkode UTF-8.
Cara penanganan operasi bucket
Bagian berikut menjelaskan cara penanganan operasi bucket saat namespace hierarkis diaktifkan.
Anda dapat mencantumkan semua bucket dengan namespace hierarkis yang diaktifkan, terlepas dari tata letak penyimpanannya. Tata letak penyimpanan bucket menjelaskan cara objek disusun dalam bucket, baik dalam namespace datar maupun namespace hierarkis. Untuk mengetahui petunjuk tentang cara melihat tata letak penyimpanan bucket, lihat Mendapatkan tata letak penyimpanan bucket. Untuk mencantumkan semua bucket, ikuti petunjuk yang dijelaskan dalam Mencantumkan bucket.
Anda dapat menghapus bucket dengan namespace hierarkis yang diaktifkan selama bucket kosong. Bucket kosong tidak berisi objek atau folder terkelola. Bucket kosong dapat berisi folder kosong (tanpa objek di dalamnya).
Cara penanganan aturan Object Lifecycle Management
Object Lifecycle Management memungkinkan Anda mengotomatiskan tindakan pada objek berdasarkan kondisi, seperti usia atau awalan. Namun, aturan Pengelolaan Siklus Proses Objek dapat berperilaku berbeda di bucket dengan namespace hierarkis dan di bucket dengan namespace datar karena operasi RenameFolder:
Aturan Object Lifecycle Management untuk bucket dengan namespace datar: Operasi penggantian nama melibatkan penggantian nama setiap objek menggunakan alat dengan menyalin setiap objek ke lokasi tujuan dan menghapus objek asli dari lokasi sumber. Akibatnya, objek baru dibuat dengan waktu pembuatan baru di lokasi tujuan. Jika aturan Pengelolaan Siklus Proses Objek berbasis usia diterapkan untuk lokasi tujuan, aturan tersebut tidak akan langsung diterapkan ke objek baru karena waktu pembuatannya direset.
Aturan Pengelolaan Siklus Proses Objek untuk bucket dengan namespace hierarkis yang diaktifkan: Mengganti nama folder beroperasi di tingkat folder, tanpa harus mengganti nama setiap objek. Akibatnya, waktu pembuatan objek dipertahankan, yang berarti aturan Object Lifecycle Management berbasis usia diterapkan ke objek yang diubah namanya segera jika memenuhi kriteria usia.
Harga
Untuk mengetahui informasi harga, lihat harga Cloud Storage.
Batasan
Berikut adalah batasan namespace hierarkis:
Anda harus memilih apakah akan menggunakan namespace hierarkis atau tidak saat membuat bucket; setelan namespace hierarkis bucket tidak dapat diubah setelah bucket dibuat.
Untuk mengaktifkan namespace hierarkis, bucket juga harus mengaktifkan akses level bucket yang seragam.
Kemampuan Cloud Storage berikut tidak didukung untuk bucket yang menggunakan namespace hierarkis:
- Kunci Bucket
- Relokasi bucket
- Replikasi lintas bucket
- Penangguhan objek
- Kunci Retensi Objek
- Pembuatan Versi Objek
Langkah berikutnya
- Buat bucket dengan namespace hierarkis diaktifkan.
- Membuat dan mengelola folder.
- Mengganti nama folder.
- Gunakan ruang nama hierarkis untuk workload Hadoop.
- Mengoptimalkan performa.
Coba sendiri
Jika Anda baru menggunakan Google Cloud, buat akun untuk mengevaluasi performa Cloud Storage dalam skenario dunia nyata. Pelanggan baru juga akan mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
Coba Cloud Storage gratis