Pilih antara penyimpanan SSD dan HDD
Saat membuat instance Bigtable, Anda memilih apakah clusternya menyimpan data di solid-state drive (SSD) atau hard disk drive (HDD):
- Penyimpanan SSD adalah pilihan yang paling efisien dan hemat biaya untuk sebagian besar kasus penggunaan.
- Penyimpanan HDD terkadang sesuai untuk set data besar yang tidak sensitif terhadap latensi atau jarang diakses.
Instance Bigtable yang menggunakan penyimpanan SSD mendukung tiered storage (Pratinjau). Anda dapat mengaktifkan tingkat penyimpanan akses jarang di tingkat tabel pada cluster SSD tempat Anda dapat menyimpan data yang jarang diakses dengan cara yang paling hemat biaya. Untuk mengetahui informasi selengkapnya, lihat Ringkasan penyimpanan bertingkat.
Apa pun jenis penyimpanan yang Anda pilih, data Anda disimpan pada sistem file hasil replikasi yang tersebar di banyak drive fisik.
Tabel berikut membandingkan jenis penyimpanan Bigtable dalam konteks penyimpanan bertingkat:
Instance dan tingkat | Kapasitas node | Latensi yang diharapkan | Operasi | Paling cocok untuk |
---|---|---|---|---|
Instance SSD, tingkat penyimpanan SSD | 5 TB | Tulis/baca: milidetik satu digit | Menulis, membaca, mengupdate, menghapus | Workload dengan throughput tulis/baca tinggi dan latensi rendah |
Instance SSD, penyimpanan bertingkat diaktifkan | 32 TB (SSD hingga 5 TB) | Tulis: ms satu digit Baca: milidetik dua digit rendah |
Menulis, membaca, mengupdate, menghapus | Set data besar dengan data yang jarang diakses |
Instance HDD, tingkat HDD | 16 TB | Tulis: ms satu digit Baca: milidetik dua digit rendah |
Menulis, membaca, mengupdate, menghapus | Set data besar dengan workload yang tidak sensitif terhadap latensi |
Untuk mengetahui informasi selengkapnya tentang performa jenis penyimpanan Bigtable, lihat Memahami performa.
Jika ragu, pilih penyimpanan SSD
Ada beberapa alasan mengapa biasanya sebaiknya menggunakan penyimpanan SSD untuk cluster Bigtable Anda:
- SSD jauh lebih cepat dan memiliki performa yang lebih terprediksi daripada HDD. Di cluster Bigtable, penyimpanan SSD memberikan latensi yang jauh lebih rendah untuk operasi baca dan tulis dibandingkan penyimpanan HDD.
- Throughput HDD jauh lebih terbatas daripada throughput SSD. Di cluster yang menggunakan penyimpanan HDD, throughput maksimum dapat tercapai sebelum penggunaan CPU mencapai 100%, situasi yang dapat Anda pantau menggunakan metrik disk load. Untuk meningkatkan throughput, Anda harus menambahkan lebih banyak node, tetapi biaya node tambahan mungkin melebihi penghematan Anda dari penggunaan penyimpanan HDD. Penyimpanan SSD tidak memiliki batasan ini, karena menawarkan throughput yang jauh lebih tinggi per node. Umumnya, cluster yang menggunakan penyimpanan SSD hanya mencapai throughput maksimum saat menggunakan semua CPU dan memori yang tersedia.
- Pembacaan baris individual di HDD sangat lambat. Karena waktu pencarian disk, penyimpanan HDD hanya mendukung 5% baris baca per detik penyimpanan SSD. Namun, pemindaian multi-baris yang besar tidak terlalu berdampak buruk.
- Penyimpanan SSD mendukung opsi penyimpanan bertingkat untuk data yang jarang diakses.
Salah satu potensi kekurangan penyimpanan SSD adalah memerlukan lebih banyak node di cluster berdasarkan jumlah data yang Anda simpan. Namun, dalam praktiknya, Anda mungkin memerlukan node tambahan tersebut agar cluster Anda dapat mengimbangi traffic masuk, tidak hanya untuk mendukung jumlah data yang Anda simpan.
Kasus penggunaan untuk penyimpanan HDD
Penyimpanan HDD cocok untuk kasus penggunaan yang memenuhi semua kriteria berikut:
- Beban kerja Anda banyak melakukan penulisan dan berbasis data.
- Beban kerja Anda tidak sensitif terhadap latensi.
- Data Anda tidak mendukung aplikasi yang ditampilkan kepada pengguna.
- Workload batch Anda sebagian besar terdiri dari pemindaian dan penulisan dengan pembacaan acak sesekali dari sejumlah kecil baris atau pembacaan titik.
- Anda tidak berencana menggunakan Data Boost, penyimpanan bertingkat, atau penskalaan node 2x.
Misalnya, jika Anda berencana menyimpan data historis yang ekstensif untuk sejumlah besar perangkat deteksi jarak jauh, lalu menggunakan data tersebut untuk menghasilkan laporan harian, penghematan biaya untuk penyimpanan HDD mungkin dapat dijadikan alasan terjadinya kompromi performa. Di sisi lain, jika Anda berencana menggunakan data untuk menampilkan dasbor real-time, mungkin data tersebut tidak akan masuk akal untuk menggunakan penyimpanan HDD—dalam kasus ini pembacaan akan jauh lebih sering dan pembacaan yang bukan pemindaian jauh lebih lambat dengan penyimpanan HDD.
Beralih antara penyimpanan SSD dan HDD
Saat Anda membuat instance Bigtable, pilihan penyimpanan SSD atau HDD untuk instance akan bersifat permanen. Anda tidak dapat menggunakan konsolGoogle Cloud untuk mengubah jenis penyimpanan yang digunakan untuk instance.
Jika Anda ingin mengubah jenis penyimpanan tempat tabel disimpan, gunakan fitur pencadangan:
- Buat atau rencanakan untuk menggunakan instance yang menggunakan jenis penyimpanan yang Anda inginkan.
- Buat cadangan tabel.
- Pulihkan dari cadangan ke tabel baru di instance lain.