SSD ストレージと HDD ストレージのいずれかを選択する
Bigtable インスタンスの作成時に、クラスタでのデータの保存先をソリッド ステート ドライブ(SSD)とハードディスク ドライブ(HDD)のどちらにするかを指定します。
- SSD ストレージは、ほとんどのユースケースで最も効率的でコスト効果の高い選択肢です。
- HDD ストレージは、大規模なデータセットで、レイテンシがあまり重要でない場合やアクセス頻度が低い場合に適切であることがあります。
SSD ストレージを使用する Bigtable インスタンスは、階層型ストレージ(プレビュー)をサポートしています。SSD クラスタのテーブルレベルで低頻度アクセス ストレージ階層を有効にすると、低頻度アクセス データを最も費用対効果の高い方法で保存できます。詳細については、階層型ストレージの概要をご覧ください。
どちらのタイプのストレージを選択した場合でも、多数の物理ドライブにわたって分散してレプリケーションされたファイル システムにデータが保存されます。
次の表に、階層型ストレージのコンテキストで Bigtable ストレージ タイプを比較します。
インスタンスと階層 | ノード容量 | 予想されるレイテンシ | 運用 | 最適な用途 |
---|---|---|---|---|
SSD インスタンス、SSD ストレージ ティア | 5 TB | 書き込み/読み取り: 1 桁のミリ秒 | 書き込み、読み取り、更新、削除 | 書き込み/読み取りスループットが高く、レイテンシが低いワークロード |
SSD インスタンス、階層型ストレージが有効 | 32 TB(最大 5 TB の SSD) | 書き込み: 1 桁のミリ秒 読み取り: 2 桁台前半のミリ秒 |
書き込み、読み取り、更新、削除 | アクセス頻度の低いデータを含む大規模なデータセット |
HDD インスタンス、HDD ティア | 16 TB | 書き込み: 1 桁のミリ秒 読み取り: 2 桁台前半のミリ秒 |
書き込み、読み取り、更新、削除 | レイテンシの影響を受けにくいワークロードを含む大規模なデータセット |
Bigtable ストレージ タイプのパフォーマンスの詳細については、パフォーマンスについてをご覧ください。
判断に迷った場合は SSD ストレージを選択する
Bigtable クラスタで SSD ストレージを使用するのが通常は最適である理由を以下に示します。
- SSD は HDD に比べて、動作がはるかに速いだけでなく、パフォーマンスの予測可能性にも優れています。Bigtable クラスタでは、SSD ストレージは HDD ストレージよりも読み取りと書き込みのレイテンシが大幅に低くなります。
- HDD のスループットには SSD のスループットより大きな制限があります。HDD ストレージを使用するクラスタでは、CPU 使用率が 100% に達する前に最大スループットに達することもあります。この状況はディスク負荷指標を使用してモニタリングできます。スループットを向上させるには、より多くのノードを追加する必要があります。しかし、追加ノードのコストが、HDD ストレージの使用によるコスト削減を超えることがあります。SSD ストレージにはそのような制約はありません。ノードあたりのスループットははるかに高いため、通常、利用可能な CPU とメモリをすべて使用している場合にのみ、SSD ストレージを使用するクラスタのスループットは最大になります。
- HDD での個々の行の読み取りは非常に低速です。ディスクのシーク時間のために、HDD ストレージでは SSD ストレージの読み取り行数(1 秒あたり)の 5% しかサポートされていません。ただし、大きな複数行のスキャンでは、それほどの低下はありません。
- SSD ストレージは、アクセス頻度の低いデータの階層型ストレージ オプションをサポートしています。
SSD ストレージの欠点となりうる点として、保存するデータの量によってはクラスタで必要となるノード数が多くなることがあげられます。しかし、ノードを増やすことで、保存するデータの量をサポートできるだけでなく、クラスタが受信トラフィックに対応できます。
HDD ストレージのユースケース
HDD ストレージは、次の条件をすべて満たしているユースケースに適しています。
- ワークロードは書き込み負荷が高く、データ駆動型です。
- ワークロードはレイテンシの影響を受けにくい。
- データがユーザー向けアプリケーションをサポートしていない。
- バッチ ワークロードは、主にスキャンと書き込みで構成され、少数の行のランダム読み取りまたはポイント読み取りがまれに行われます。
- Data Boost、階層型ストレージ、2 倍のノード スケーリングを使用する予定がない。
たとえば、多数のリモート センシング装置の詳細な履歴データを保存し、そのデータを使用して日次レポートを生成する予定がある場合には、パフォーマンスが低下しても HDD ストレージのコスト削減が優先されることがあります。それに対して、データを使用してリアルタイム ダッシュボードを表示する場合は、HDD ストレージの使用は適切とはいえません。この場合、読み取りが頻繁に行われ、またスキャンではない読み取りははるかに遅いからです。。
SSD ストレージと HDD ストレージの切り替え
Bigtable インスタンスを作成した後は、そのインスタンスでの SSD ストレージまたは HDD ストレージの選択は変更できません。Google Cloud コンソールを使用して、インスタンスで使用しているストレージのタイプを変更することはできません。
テーブルの保存場所であるストレージ タイプを変更する場合は、バックアップ機能を使用します。
- 希望するストレージ タイプを使用するインスタンスを作成するか、インスタンスを使用するように計画します。
- テーブルのバックアップを作成します。
- バックアップから、別のインスタンスの新しいテーブルに復元します。
次のステップ
- SSD または HDD ストレージを持つインスタンスを作成する。
- 階層型ストレージについて学習する。