[健全性とトラブルシューティング] ページでは、サービスとアプリケーションの健全性を確認できます。
- Cloud Monitoring で設定したアラート ポリシーに基づいて、未解決のアラートを表示します。アラート ポリシーの条件が満たされると、Monitoring は未解決のアラートをインシデントとして参照します。
- アクティブな Google Cloud インシデントを表示します。これらのインシデントは、 Google Cloudサービスの停止またはパフォーマンスの低下に関するものです。
- 使用率、レイテンシ、エラーなど、 Google Cloudリソースの健全性とパフォーマンスに関する指標を表示します。
App Hub アプリケーションで、プロジェクトとサポートされているインフラストラクチャの健全性データを表示できます。
- プロジェクト ビューでは、選択したプロジェクトのアクティブな Google Cloudプロダクトのヘルスデータを表示できます。
- アプリケーション ビューでは、選択したアプリケーション内のサービスとワークロードのヘルスデータを表示できます。
Gemini Cloud Assist の調査を使用して、問題のトラブルシューティングを行うこともできます。
始める前に
App Hub アプリケーションのデータを表示するには、次の手順が完了していることを確認します。
フォルダに App Hub を設定して、アプリケーションを作成します。
アプリケーションのログ、指標、トレースの集計を設定します。
調査を使用するには、Gemini Cloud Assist を設定します。
必要なロール
アプリケーションとリソースの健全性データを表示するために必要な権限を取得するには、プロジェクト(プロジェクト ビュー)またはフォルダの管理プロジェクト(アプリケーション ビュー)に対する次の IAM ロールを付与するよう管理者に依頼してください。
-
アプリケーションとプロジェクトのデータを表示する: Cloud Hub オペレーター (
roles/cloudhub.operator) -
調査を作成して表示する: 調査作成者 (
roles/geminicloudassist.investigationCreator)
ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。
必要な権限は、カスタムロールや他の事前定義ロールから取得することもできます。
分析に基づいて変更を行う場合は、追加の権限が必要になることがあります。また、必要な権限を持つ組織のメンバーと連携する必要がある場合もあります。たとえば、GKE クラスタの構成を変更するには、適切な GKE 権限が必要です。
健全性とトラブルシューティングの情報を表示する
Google Cloud コンソールで、[ヘルスとトラブルシューティング] ページに移動します。
表示するプロジェクトまたはアプリケーションを選択します。
アプリケーションのデータを表示するには、アプリケーション管理用に構成されたフォルダを選択します。アプリケーション管理用に構成されたフォルダには、特別なアイコン(
)が表示されます。フォルダの管理プロジェクトにも特別なアイコン(
)が表示され、プロジェクト名は FOLDER-NAME-mpの形式になります。フォルダではなく管理プロジェクトを選択すると、プロジェクト選択ツールは選択を自動的にフォルダに変更します。個々のプロジェクトのデータを表示するには、表示するリソースを含むプロジェクトを選択します。
期間セレクタで、表示する期間を選択します。デフォルトでは、ページには過去 1 時間のアラート、インシデント、ヘルスデータが表示されます。 Google Cloud
選択した期間の次の情報がページに表示されます。
- 未解決のアラート: 選択したプロジェクトまたは選択したアプリケーションに関連付けられているアラート ポリシーの未解決のアラートの総数が表示されます。Monitoring でアラートを表示するには、[アラートを表示] をクリックします。アラート(Monitoring ではインシデントと呼びます)の表示の詳細については、指標ベースのアラート ポリシーのインシデントをご覧ください。
- Google Cloud インシデント: 選択したプロジェクトまたはアプリケーションの Google Cloudインシデントの合計数を表示します。Personalized Service Health でインシデントを表示するには、[インシデントを表示] をクリックします。Service Health でのインシデントの表示の詳細を確認する。
- Google Cloud プロダクト(プロジェクト ビュー): 選択したプロジェクトのアクティブなGoogle Cloud プロダクトごとに、オープン アラートと Service Health イベント(インシデントを含む)を表示します。選択した商品の主な健康データを示すグラフが、商品リストの下に表示されます。
- サービスとワークロード(アプリケーション ビュー): アプリケーション内のアクティブなGoogle Cloud サービスまたはワークロードごとに、未解決のアラートとサービス ヘルス イベント(インシデントを含む)を表示します。選択したサービスまたはワークロードの主要な健全性データを含むグラフが、サービスとワークロードのリストの下に表示されます。
リストに表示されているプロダクト、サービス、ワークロードの詳細を表示するには、リストでその名前をクリックします。次のオプションを使用して、発生したイベントを把握したり、問題のトラブルシューティングを行ったりできます。
選択したプロダクト、サービス、ワークロードのグラフを確認します。各グラフには、選択した期間の健康状態の指標が表示されます。
グラフには関連するイベントも表示されます。イベントタイプにはいくつかの種類があります。
- Cloud Monitoring アラート イベント。
- Service Health イベント
- プロダクト固有のイベント
デフォルトでは、グラフには推奨イベントが表示されますが、ページ上部の [アノテーション] セレクタを使用して、表示するイベントを選択できます。グラフでイベントの表示と非表示を切り替える方法については、ダッシュボードにイベントを表示するをご覧ください。
グラフの操作方法は、他のモニタリング グラフと同じです。グラフデータの探索の詳細
プロダクト、サービス、ワークロードの未解決のアラートを表示するには、[アラート] 列のリンクをクリックします。
プロダクト、サービス、ワークロードに関連するインシデントを表示するには、[Google Cloud インシデント] 列のリンクをクリックします。 Google Cloud
プロジェクト ビューでプロダクトのレビューの詳細を表示するには、[詳細を表示] をクリックします。各プロダクトは、問題の診断とトラブルシューティングに役立つ追加のオブザーバビリティ データ、ログ、その他の情報を提供します。
Monitoring でアプリケーション ワークロードまたはサービスの詳細を開くには、[ダッシュボードを表示] をクリックします。[アプリケーション モニタリング] ページに、ワークロードまたはサービスのダッシュボードが表示されます。
Gemini Cloud Assist によるトラブルシューティング
Gemini Cloud Assist Investigations は、インフラストラクチャとアプリケーションのトラブルシューティングを行うための根本原因分析(RCA)ツールです。 Google Cloud調査は、問題をより迅速に診断して解決するのに役立ちます。
Cloud Hub では、最近の調査を表示したり、新しい調査を開始したりできます。
調査を作成または表示する手順は次のとおりです。
Google Cloud コンソールで、[ヘルスとトラブルシューティング] ページに移動します。
表示するプロジェクトまたはアプリケーションを選択します。
アプリケーションのデータを表示するには、アプリケーション管理用に構成されているフォルダを選択します。アプリケーション管理用に構成されたフォルダには、特別なアイコン(
)が表示されます。フォルダの管理プロジェクトにも特別なアイコン(
)が表示され、プロジェクト名は FOLDER-NAME-mpの形式になります。フォルダではなく管理プロジェクトを選択すると、プロジェクト選択ツールは選択を自動的にフォルダに変更します。個々のプロジェクトのデータを表示するには、表示するリソースを含むプロジェクトを選択します。
[最近の Cloud Assist 調査] セクションには、作成した調査または表示権限のある調査が表示されます。
次のステップ
- モニタリング アラートの詳細を確認する。
- 詳しくは、Service Health と Google Cloudインシデントをご覧ください。
- モニタリング ダッシュボードについて学習する。
- Gemini Cloud Assist の調査について学習する。