選擇 SSD 或 HDD 儲存空間
建立 Bigtable 執行個體時,您可以選擇叢集將資料儲存在固態硬碟 (SSD) 或硬碟 (HDD):
- 在大多數的情況下,SSD 的儲存空間是最有效且最具成本效益的選擇。
- 有時,HDD 儲存空間適合用於不對延遲時間敏感或不常存取的大型資料集。
使用 SSD 儲存空間的 Bigtable 執行個體支援分層儲存空間 (搶先版)。您可以在 SSD 叢集上啟用資料表層級的不常存取儲存空間層級,以最具成本效益的方式儲存不常存取的資料。詳情請參閱「分層儲存空間總覽」。
不管您選取了哪一種儲存型態,您的資料都會被儲存於橫跨多個實體硬碟的分散式複製檔案系統中。
下表比較分層儲存空間中的 Bigtable 儲存空間類型:
執行個體和層級 | 節點容量 | 預期延遲時間 | 作業 | 適用情境 |
---|---|---|---|---|
SSD 執行個體、SSD 儲存空間層級 | 5 TB | 寫入/讀取:十毫秒內 | 寫入、讀取、更新、刪除 | 高寫入/讀取處理量和低延遲工作負載 |
SSD 執行個體,已啟用分層儲存空間 | 32 TB (最多 5 TB SSD) | 寫入:十毫秒內 讀取:低雙位數毫秒 |
寫入、讀取、更新、刪除 | 含有不常存取資料的大型資料集 |
HDD 執行個體、HDD 層級 | 16 TB | 寫入:十毫秒內 讀取:低雙位數毫秒 |
寫入、讀取、更新、刪除 | 延遲不敏感工作負載的大型資料集 |
如要進一步瞭解 Bigtable 儲存空間類型的效能,請參閱「瞭解效能」。
若不確定,選擇 SSD 儲存空間就對了
通常最好為 Bigtable 叢集使用 SSD 儲存空間,原因如下:
- 與 HDD 相比之下,SSD 快速許多且其效能可控制在預期範圍內。 在 Bigtable 叢集中,SSD 儲存空間的讀寫延遲遠低於 HDD 儲存空間。
- 與 SSD 的總處理量相比,HDD 的總處理量較有限。在採用 HDD 儲存空間的叢集中,CPU 使用率可能還沒達到 100%,但輸送量就已達到上限,您可以透過「磁碟負載」指標監控這種情況。如要提高輸送量,必須新增更多節點,但額外節點的費用可能會超過使用硬碟儲存空間所節省的費用。SSD 儲存空間就沒有以上限制,因為其在單一節點提供了較大的總處理量。在一般情況下,採用 SSD 儲存空間的叢集只會在所有可用的 CPU 及記憶體都被使用的狀況下,才會達到最大總處理量。
- HDD 的個別資料列讀取速度非常緩慢。這是因為在磁碟搜尋時間,HDD 儲存空間支援的每秒資料列讀取數目只有 SSD 儲存空間的 5%。然而,大型的多資料列掃描作業則不會受到不利影響。
- SSD 儲存空間支援分層儲存選項,可存放不常存取的資料。
使用 SSD 儲存空間有一項潛在的缺點,那就是當您儲存大量的資料時,您的叢集需要更多的節點。但實際上,您可能需要這些額外的節點,讓您的叢集足以負荷傳入的流量,而不僅是承受您儲存的大量資料。
HDD 儲存空間的使用案例
HDD 儲存空間適用於符合下列所有條件的用途:
- 您的工作負載是寫入密集型,且以資料為準。
- 工作負載不易受延遲影響。
- 您的資料不支援面向使用者的應用程式。
- 您的批次工作負載主要由掃描和寫入作業組成,偶爾會隨機讀取少量資料列或點讀取。
- 您不打算使用 Data Boost、分層儲存空間或節點 2 倍擴充。
例如,若您打算為大量的遠端感測裝置儲存豐富的歷史資料,並且用這些資料生成每日報告,則使用 HDD 儲存空間,以效能換取節省成本是可行的。另一方面,如果您打算使用資料顯示即時資訊主頁,則使用 HDD 儲存空間可能不適合,因為在這種情況下,讀取作業會更加頻繁,而且使用 HDD 儲存空間時,非掃描讀取作業的速度會慢很多。
切換 SSD 及 HDD 儲存空間
建立 Bigtable 執行個體時,您為執行個體選擇的 SSD 或 HDD 儲存空間將無法變更。您無法使用Google Cloud 控制台變更執行個體使用的儲存空間類型。
如要變更表格的儲存類型,請使用備份功能:
- 建立或規劃使用所需儲存空間類型的執行個體。
- 建立資料表備份。
- 從備份還原至其他執行個體中的新資料表。