選擇 SSD 或 HDD 儲存空間

建立 Bigtable 執行個體時,您可以選擇叢集將資料儲存在固態硬碟 (SSD) 或硬碟 (HDD):

  • 在大多數的情況下,SSD 的儲存空間是最有效且最具成本效益的選擇。
  • 有時,HDD 儲存空間適合用於不對延遲時間敏感或不常存取的大型資料集。

使用 SSD 儲存空間的 Bigtable 執行個體支援分層儲存空間 (搶先版)。您可以在 SSD 叢集上啟用資料表層級的不常存取儲存空間層級,以最具成本效益的方式儲存不常存取的資料。詳情請參閱「分層儲存空間總覽」。

不管您選取了哪一種儲存型態,您的資料都會被儲存於橫跨多個實體硬碟的分散式複製檔案系統中。

下表比較分層儲存空間中的 Bigtable 儲存空間類型:

執行個體和層級 節點容量 預期延遲時間 作業 適用情境
SSD 執行個體、SSD 儲存空間層級 5 TB 寫入/讀取:十毫秒內 寫入、讀取、更新、刪除 高寫入/讀取處理量和低延遲工作負載
SSD 執行個體,已啟用分層儲存空間 32 TB (最多 5 TB SSD)

寫入:十毫秒內

讀取:低雙位數毫秒

寫入、讀取、更新、刪除 含有不常存取資料的大型資料集
HDD 執行個體、HDD 層級 16 TB

寫入:十毫秒內

讀取:低雙位數毫秒

寫入、讀取、更新、刪除 延遲不敏感工作負載的大型資料集

如要進一步瞭解 Bigtable 儲存空間類型的效能,請參閱「瞭解效能」。

若不確定,選擇 SSD 儲存空間就對了

通常最好為 Bigtable 叢集使用 SSD 儲存空間,原因如下:

  • 與 HDD 相比之下,SSD 快速許多且其效能可控制在預期範圍內。 在 Bigtable 叢集中,SSD 儲存空間的讀寫延遲遠低於 HDD 儲存空間。
  • 與 SSD 的總處理量相比,HDD 的總處理量較有限。在採用 HDD 儲存空間的叢集中,CPU 使用率可能還沒達到 100%,但輸送量就已達到上限,您可以透過「磁碟負載」指標監控這種情況。如要提高輸送量,必須新增更多節點,但額外節點的費用可能會超過使用硬碟儲存空間所節省的費用。SSD 儲存空間就沒有以上限制,因為其在單一節點提供了較大的總處理量。在一般情況下,採用 SSD 儲存空間的叢集只會在所有可用的 CPU 及記憶體都被使用的狀況下,才會達到最大總處理量。
  • HDD 的個別資料列讀取速度非常緩慢。這是因為在磁碟搜尋時間,HDD 儲存空間支援的每秒資料列讀取數目只有 SSD 儲存空間的 5%。然而,大型的多資料列掃描作業則不會受到不利影響。
  • SSD 儲存空間支援分層儲存選項,可存放不常存取的資料

使用 SSD 儲存空間有一項潛在的缺點,那就是當您儲存大量的資料時,您的叢集需要更多的節點。但實際上,您可能需要這些額外的節點,讓您的叢集足以負荷傳入的流量,而不僅是承受您儲存的大量資料。

HDD 儲存空間的使用案例

HDD 儲存空間適用於符合下列所有條件的用途:

  • 您的工作負載是寫入密集型,且以資料為準。
  • 工作負載不易受延遲影響。
  • 您的資料不支援面向使用者的應用程式。
  • 您的批次工作負載主要由掃描和寫入作業組成,偶爾會隨機讀取少量資料列或點讀取。
  • 您不打算使用 Data Boost、分層儲存空間或節點 2 倍擴充

例如,若您打算為大量的遠端感測裝置儲存豐富的歷史資料,並且用這些資料生成每日報告,則使用 HDD 儲存空間,以效能換取節省成本是可行的。另一方面,如果您打算使用資料顯示即時資訊主頁,則使用 HDD 儲存空間可能不適合,因為在這種情況下,讀取作業會更加頻繁,而且使用 HDD 儲存空間時,非掃描讀取作業的速度會慢很多。

切換 SSD 及 HDD 儲存空間

建立 Bigtable 執行個體時,您為執行個體選擇的 SSD 或 HDD 儲存空間將無法變更。您無法使用Google Cloud 控制台變更執行個體使用的儲存空間類型。

如要變更表格的儲存類型,請使用備份功能

  1. 建立或規劃使用所需儲存空間類型的執行個體。
  2. 建立資料表備份。
  3. 從備份還原至其他執行個體中的新資料表。

後續步驟