このページでは、Google Distributed Cloud 接続インストールで高可用性を確保するためのベスト プラクティスについて説明します。Distributed Cloud Connected にはサービスレベル契約(SLA)はなく、このページで説明するサービスレベル目標(SLO)のみが提供されます。
可用性のレベルを選択して実装する
ビジネス要件に最適な Distributed Cloud 接続ワークロードの可用性レベルを選択する必要があります。たとえば、小売店のセルフチェックアウト アプリケーションは、モバイル ネットワーク事業者のエッジ RAN デプロイよりも可用性リスクがはるかに低くなります。
目標可用性は、緊急用に予約する Distributed Cloud の予備リソース容量に正比例します。次の表で、この関係について説明します。これらの見積もりには、メンテナンスの時間枠でスケジュールされたダウンタイムは含まれません。
Distributed Cloud コネクテッド ソフトウェアは、各物理マシンで一部のリソースを消費します。この量は、Distributed Cloud コネクテッド デプロイの特定の構成によって異なります。Google は、この量を測定し、ワークロードの分散を計画する際に考慮するために、Distributed Cloud 接続デプロイのベンチマークを行うことを推奨しています。
| GDC コネクテッド フォーム ファクタ | 使用中の容量 | 予約済み容量 | ターゲットの可用性 |
|---|---|---|---|
| GDC コネクテッド ラック (6 台のマシン クラスタ 1 つ) |
83.33% | 16.67% | 99.9% |
| GDC コネクテッド ラック (6 台のマシン クラスタ 1 つ) |
100% | 0% | 93.5% |
| GDC コネクテッド サーバー (3 台のマシンで構成される単一クラスタ) |
66.6% | 33.3% | 99.9% |
ハードウェア障害や再起動が必要なノードが原因で、容量が突然減少することがあります。これに備えるには、リソース割り当てを考慮してワークロードを設計し、選択した可用性レベルを満たす容量を各 Distributed Cloud 接続ノードで常に利用できるようにする必要があります。
たとえば、Distributed Cloud 接続ラックのデプロイで 99.9% の目標可用性を実現するには、各 Distributed Cloud 接続クラスタ内の 6 台の物理マシンのうち 1 台がバックアップとして使用できるようにワークロードを構成する必要があります。
存続モードを使用する
Distributed Cloud では、Distributed Cloud コネクテッド ハードウェアで実行されるローカル コントロール プレーンを使用するクラスタを作成できます。このようなクラスタでは、 Google Cloud への接続が失われた場合でもワークロードの実行を継続できます。詳細については、Distributed Cloud connected の存続可能性モードをご覧ください。
ソフトウェア アップデートとメンテナンスの時間枠について
Google は、Distributed Cloud connected ソフトウェアを定期的に更新します。このソフトウェア更新は必須であり、無効にすることはできません。Distributed Cloud connected を使用すると、Distributed Cloud connected クラスタごとに個別のメンテナンス時間枠を指定できます。
メンテナンスの時間枠を使用すると、コントロール プレーンとノードの自動アップグレードを実行できるタイミングを制御できるため、ワークロードの一時的な中断を軽減できます。メンテナンスの時間枠は、次のような場合に役立ちます。
- オフピーク時: 自動アップグレードをトラフィックが減少するオフピーク時にスケジュールすることにより、ダウンタイムの可能性を最小限に抑えたい。
- オンコール: アップグレードをモニタリングして予期せぬ問題を管理できるように、アップグレードを勤務時間中に実行したい。
- 複数クラスタのアップグレード: 異なるリージョンの複数のクラスタに、指定した間隔で一度に 1 つずつアップグレードをロールアウトしたい。
自動アップグレードに加えて、Google は他のメンテナンス タスクを行うこともあります。このような場合、可能な限りクラスタのメンテナンス ウィンドウが尊重されます。
タスクがメンテナンスの時間枠を超えて実行されると、Distributed Cloud Connected はタスクの一時停止を試みます。その後、次のメンテナンスの時間枠でこれらのタスクの再開を試みます。
Distributed Cloud connected は、メンテナンスの時間枠の外で予定外の緊急アップグレードをロールアウトする権限を有します。また、非推奨のソフトウェアや古いソフトウェアからの必須アップグレードがメンテナンス時間枠の外で自動的に行われることがあります。
クラスタはいつでも手動でアップグレードできます。手動のアップグレードは、メンテナンスの時間枠を無視してすぐに開始されます。
新規または既存のクラスタに対してメンテナンスの時間枠を設定する方法については、メンテナンスの時間枠の構成をご覧ください。
制限事項
メンテナンスの時間枠には次の制限があります。
クラスタごとに 1 つのメンテナンスの時間枠。メンテナンスの時間枠は、クラスタごとに 1 つだけ構成できます。新しいメンテナンスの時間枠を構成すると、以前のメンテナンスの時間枠が上書きされます。
メンテナンスの時間枠のタイムゾーン。メンテナンス時間枠を構成および表示する場合、使用しているツールによって表示される時間が異なります。詳細については、以下のセクションをご覧ください。
メンテナンスの時間枠を構成する場合
より一般的な --maintenance-window フラグを使用してメンテナンスの時間枠を構成する場合、タイムゾーンを指定できません。Google Cloud CLI または API を使用すると、UTC で時刻が表示されます。Google Cloud コンソールでは、ローカル タイムゾーンを使用して時刻が表示されます。
--maintenance-window-start など、より詳細なフラグを使用する場合は、値の一部としてタイムゾーンを指定できます。タイムゾーンを省略すると、ローカル タイムゾーンが使用されます。時間は常に UTC で保存されます。
メンテナンスの時間枠を表示する場合
クラスタの情報を表示するとき、情報の表示方法に応じて、メンテナンスの時間枠のタイムスタンプは UTC またはローカル タイムゾーンで表示されます。
- Google Cloud コンソールを使用してクラスタの情報を表示する場合、時刻は常にローカル タイムゾーンで表示されます。
- gcloud CLI を使用してクラスタの情報を表示する場合、時刻は常に UTC で表示されます。
どちらの場合も、RRULE は常に UTC です。たとえば、曜日を指定すると、日付は UTC で表示されます。
クラスタのメンテナンスの時間枠を構成する
Distributed Cloud Connected を使用すると、Distributed Cloud Connected クラスタごとにメンテナンス時間枠を指定できます。このウィンドウは、指定した時間と頻度でのみ Distributed Cloud ソフトウェアを更新するように Google に指示します。
次のルールは、Distributed Cloud 接続クラスタのメンテナンス ウィンドウに適用されます。
- Distributed Cloud コネクテッド クラスタのメンテナンス ウィンドウを指定すると、Google は Distributed Cloud コネクテッド リリースノートで更新が発表されてから 48 時間後に、Distributed Cloud コネクテッド ソフトウェアを更新します。リリースノート ページで、Distributed Cloud Connected リリースノートの RSS フィードを購読すると、ソフトウェア アップデートがリリースされるたびに通知を受け取ることができます。
- メンテナンスの時間枠の最短時間は 6 時間です。Distributed Cloud 接続インストールとビジネス要件の複雑さに基づいて、より長い期間を指定できます。
- ソフトウェア アップデートの最小頻度は週 1 回です。メンテナンスの時間枠は、週単位または日単位で指定できます。特定の日付を含めたり除外したりできます。
- メンテナンスの時間枠がすでにスケジュールされている場合や、メンテナンスの時間枠が進行中の場合を除き、クラスタのメンテナンスの時間枠のスケジュールはいつでも変更できます。
- 指定した時間枠でソフトウェア更新が完了しない場合は、一時停止され、次のスケジュールされたメンテナンス時間枠に再開されます。
詳細な手順については、クラスタのメンテナンスの時間枠を構成するをご覧ください。
故障したハードウェアの修理
Google は、Distributed Cloud 接続ハードウェアの障害を検出すると、3 営業日以内にサイト訪問のスケジュールを設定しようとします。Google 認定技術者が必要な診断と修理を行うには、Distributed Cloud に接続されたハードウェアへのアクセス権を付与する必要があります。
Distributed Cloud コネクテッド ハードウェアで障害が発生した場合、Distributed Cloud コネクテッド ハードウェアが自己暗号化ディスク(SED)ストレージを使用しているかどうかに応じて、次のいずれかのシナリオが適用されます。
Distributed Cloud コネクテッド ラックは、非 SED ドライブにデータを保存します。Google がオンサイト修理を行う場合、サービス開始前に、影響を受ける Distributed Cloud 接続マシンからすべてのディスク ドライブが取り外され、修理期間中はお客様の管理下に置かれます。
Distributed Cloud 接続サーバーは、SED ドライブにデータを保存します。マシンで障害が発生すると、Google はマシン全体を交換します。マシンがお客様の施設から搬出される前に、Google はすべてのドライブからデータが安全に消去されていることを確認します。
その他の障害点
Google の制御外で、Distributed Cloud 接続の可用性に影響する可能性がある Distributed Cloud インストールの次の側面を維持するのは、お客様の責任です。
- Distributed Cloud コネクテッド ハードウェアに保存することを選択したすべてのデータ。これには、機能する冗長バックアップと、Distributed Cloud 接続ハードウェアを Google に返却する前のデータのエクスポートが含まれます。
- 電源。
- 気温、湿度、冷房。
- 物理的なハードウェア セキュリティ。
- ローカル ネットワークのセキュリティ。
- ローカル ネットワークとインターネット接続:
- クラウド コントロール プレーン クラスタの場合、Distributed Cloud コネクテッドには Google Cloud への継続的な接続が必要であり、この接続がないと機能しません。
- ローカル コントロール プレーン クラスタの場合、Distributed Cloud Connected は 7 日ごとに Google Cloud に再接続して、セキュリティ トークンと暗号鍵を更新し、ロギング データと管理データを同期する必要があります。