このページでは、Google Distributed Cloud インストールの高可用性を確保するためのベスト プラクティスについて説明します。Distributed Cloud ではサービスレベル契約(SLA)は提供されず、このページで説明するサービスレベル目標(SLO)のみが提供されます。
可用性のレベルを選択して実装する
ビジネス要件に最適な Distributed Cloud ワークロードの可用性レベルを選択する必要があります。たとえば、小売店のセルフチェックアウト アプリケーションは、モバイル ネットワーク事業者のエッジ RAN デプロイよりも可用性リスクがはるかに低くなります。
目標可用性は、緊急用に予約する Distributed Cloud の予備リソース容量に正比例します。次の表で、この関係について説明します。これらの見積もりには、メンテナンスの時間枠でスケジュールされたダウンタイムは含まれません。
Distributed Cloud コネクテッド ソフトウェアは、各物理マシンで一部のリソースを消費します。この量は、Distributed Cloud コネクテッド デプロイの特定の構成によって異なります。Google は、この量を測定し、ワークロードの分散を計画する際に考慮するために、Distributed Cloud 接続デプロイのベンチマークを行うことを推奨しています。
| GDC Edge のフォーム ファクタ | 使用中の容量 | 予約済み容量 | ターゲットの可用性 |
|---|---|---|---|
| GDC Edge ラック (6 台のマシンで構成される単一クラスタ) |
83.33% | 16.67% | 99.9% |
| GDC Edge ラック (6 台のマシンで構成される単一クラスタ) |
100% | 0% | 93.5% |
| GDC Edge サーバー (3 台のマシンで構成される単一クラスタ) |
66.6% | 33.3% | 99.9% |
ハードウェア障害や再起動が必要なノードが原因で、容量が突然減少することがあります。これに備えるには、リソース割り当てを考慮してワークロードを設計し、選択した可用性レベルを満たす容量を各 Distributed Cloud ノードで常に使用できるようにする必要があります。
たとえば、Distributed Cloud Rack デプロイで 99.9% の目標可用性を実現するには、各 Distributed Cloud クラスタの 6 台の物理マシンのうち 1 台がバックアップとして使用できるようにワークロードを構成する必要があります。
存続モードを使用する
Distributed Cloud では、Distributed Cloud ハードウェアで実行されるローカル コントロール プレーンを使用するクラスタを作成できます。このようなクラスタでは、 Google Cloud への接続が失われた場合でもワークロードの実行を継続できます。詳細については、Distributed Cloud の存続モードをご覧ください。
ソフトウェア アップデートとメンテナンスの時間枠について
Google は Distributed Cloud ソフトウェアを定期的に更新します。このソフトウェア更新は必須であり、無効にすることはできません。Distributed Cloud では、Distributed Cloud クラスタごとに個別のメンテナンス時間枠を指定できます。
メンテナンスの時間枠を使用すると、コントロール プレーンとノードの自動アップグレードを実行できるタイミングを制御できるため、ワークロードの一時的な中断を軽減できます。メンテナンスの時間枠は、次のような場合に役立ちます。
- オフピーク時: 自動アップグレードをトラフィックが減少するオフピーク時にスケジュールすることにより、ダウンタイムの可能性を最小限に抑えたい。
- オンコール: アップグレードをモニタリングして予期せぬ問題を管理できるように、アップグレードを勤務時間中に実行したい。
- 複数クラスタのアップグレード: 異なるリージョンの複数のクラスタに、指定した間隔で一度に 1 つずつアップグレードをロールアウトしたい。
自動アップグレードに加えて、Google は他のメンテナンス タスクを行うこともあります。このような場合、可能な限りクラスタのメンテナンス ウィンドウが尊重されます。
タスクがメンテナンスの時間枠を超えて実行されると、Distributed Cloud はタスクの一時停止を試みます。その後、次のメンテナンスの時間枠でこれらのタスクの再開を試みます。
Distributed Cloud は、メンテナンスの時間枠の外で予定外の緊急アップグレードをロールアウトする権限を有します。また、非推奨のソフトウェアや古いソフトウェアからの必須アップグレードがメンテナンス時間枠の外で自動的に行われることがあります。
クラスタはいつでも手動でアップグレードできます。手動のアップグレードは、メンテナンスの時間枠を無視してすぐに開始されます。
新規または既存のクラスタに対してメンテナンスの時間枠を設定する方法については、メンテナンスの時間枠の構成をご覧ください。
制限事項
メンテナンスの時間枠には次の制限があります。
クラスタごとに 1 つのメンテナンスの時間枠。メンテナンスの時間枠は、クラスタごとに 1 つだけ構成できます。新しいメンテナンスの時間枠を構成すると、以前のメンテナンスの時間枠が上書きされます。
メンテナンスの時間枠のタイムゾーン。メンテナンス時間枠を構成および表示する場合、使用しているツールによって表示される時間が異なります。詳細については、以下のセクションをご覧ください。
メンテナンスの時間枠を構成する場合
より一般的な --maintenance-window フラグを使用してメンテナンスの時間枠を構成する場合、タイムゾーンを指定できません。Google Cloud CLI または API を使用すると、UTC で時刻が表示されます。Google Cloud コンソールでは、ローカル タイムゾーンを使用して時刻が表示されます。
--maintenance-window-start など、より詳細なフラグを使用する場合は、値の一部としてタイムゾーンを指定できます。タイムゾーンを省略すると、ローカル タイムゾーンが使用されます。時間は常に UTC で保存されます。
メンテナンスの時間枠を表示する場合
クラスタの情報を表示するとき、情報の表示方法に応じて、メンテナンスの時間枠のタイムスタンプは UTC またはローカル タイムゾーンで表示されます。
- Google Cloud コンソールを使用してクラスタの情報を表示する場合、時刻は常にローカル タイムゾーンで表示されます。
- gcloud CLI を使用してクラスタの情報を表示する場合、時刻は常に UTC で表示されます。
どちらの場合も、RRULE は常に UTC です。たとえば、曜日を指定すると、日付は UTC で表示されます。
クラスタのメンテナンスの時間枠を構成する
Distributed Cloud では、各 Distributed Cloud クラスタのメンテナンス時間枠を指定できます。このウィンドウは、指定した時間と頻度でのみ Distributed Cloud ソフトウェアを更新するように Google に指示します。
次のルールは、Distributed Cloud クラスタのメンテナンス ウィンドウに適用されます。
- Distributed Cloud クラスタのメンテナンスの時間枠を指定すると、Google は Distributed Cloud リリースノートで更新が発表されてから 48 時間後に Distributed Cloud ソフトウェアを更新します。リリースノート ページで、Distributed Cloud リリースノートの RSS フィードを購読して、ソフトウェア アップデートのリリースに関する最新情報を入手できます。
- メンテナンスの時間枠の最短時間は 6 時間です。Distributed Cloud のインストールとビジネス要件の複雑さに基づいて、より長い期間を指定できます。
- ソフトウェア アップデートの最小頻度は週 1 回です。メンテナンスの時間枠は、週単位または日単位で指定できます。特定の日付を含めたり除外したりできます。
- メンテナンスの時間枠がすでにスケジュールされている場合や、メンテナンスの時間枠が進行中の場合を除き、クラスタのメンテナンスの時間枠のスケジュールはいつでも変更できます。
- 指定した時間枠でソフトウェア更新が完了しない場合は、一時停止され、次のスケジュールされたメンテナンス時間枠に再開されます。
詳細な手順については、クラスタのメンテナンスの時間枠を構成するをご覧ください。
故障したハードウェアの修理
Google は、Distributed Cloud ハードウェアの障害を検出すると、3 営業日以内にサイト訪問のスケジュールを設定しようとします。Google 認定技術者が必要な診断と修理を行うには、Distributed Cloud ハードウェアへのアクセス権を付与する必要があります。
Distributed Cloud ハードウェアで障害が発生した場合、Distributed Cloud ハードウェアが自己暗号化ディスク(SED)ストレージを使用しているかどうかに応じて、次のいずれかのシナリオが適用されます。
Distributed Cloud Racks は、SED 以外のドライブにデータを保存します。Google がオンサイト修理を行う場合、修理が開始される前に、影響を受ける Distributed Cloud マシンからすべてのディスク ドライブが取り外され、修理期間中はお客様の管理下に置かれます。
Distributed Cloud Servers は、SED ドライブにデータを保存します。マシンで障害が発生すると、Google はマシン全体を交換します。マシンがお客様の施設から搬出される前に、Google はすべてのドライブからデータが安全に消去されていることを確認します。
その他の障害点
Google の制御外で、Distributed Cloud の可用性に影響を与える可能性がある Distributed Cloud インストールの次の側面を維持する責任はお客様にあります。
- Distributed Cloud ハードウェアに保存することを選択したすべてのデータ。これには、機能する冗長バックアップと、Distributed Cloud ハードウェアを Google に返却する前のデータのエクスポートが含まれます。
- 電源。
- 気温、湿度、冷房。
- 物理的なハードウェア セキュリティ。
- ローカル ネットワークのセキュリティ。
- ローカル ネットワークとインターネット接続:
- クラウド コントロール プレーン クラスタの場合、Distributed Cloud には Google Cloud への常時接続が必要であり、この接続がないと機能しません。
- ローカル コントロール プレーン クラスタの場合、Distributed Cloud は 7 日ごとに Google Cloud に再接続して、セキュリティ トークンと暗号鍵を更新し、ロギング データと管理データを同期する必要があります。