ML Diagnostics で機械学習の実行を表示する

機械学習の実行とは、機械学習スクリプトまたはパイプラインの 1 回の完全な実行のことです。ML Diagnostics を使用すると、 コンソール Google Cloud で機械学習の実行を CLI または SDK を使用して表示できます。

Cluster Director で機械学習の実行をすべて表示するには:

  1. コンソールで、[Cluster Director] ページに移動します。 Google Cloud
  2. [実行診断] タブをクリックします。

Cluster Director の実行診断に移動

Google Kubernetes Engine で機械学習の実行をすべて表示するには:

  1. コンソールで [Kubernetes] ページに移動します。 Google Cloud
  2. ナビゲーション メニューで [AI/ML] をクリックします。
  3. [実行診断] タブをクリックします。

GKE AI/ML の実行診断に移動

Cluster Director と GKE の両方で、次の情報が表示されます。

  • 実行の概要: すべての 機械学習の実行の概要情報を含むリストビュー テーブル。
  • 実行の詳細: 各実行の実行の詳細(構成や実行情報など)。
  • 指標の時系列グラフ: モデル指標、 パフォーマンス指標、システム指標など、すべての指標。これらの指標は、ログ エクスプローラでも確認できます。metrics.record() メソッドで記録された指標はログエントリとして書き込まれ、フィルタリングしたり、ログベースの指標の作成に使用したりできます。
  • プロファイリング情報: 特定の実行のすべてのプロファイル セッションを含む [プロファイル] タブ。XProf ビューアへのリンクがあります。これには、プログラマティック プロファイル キャプチャとオンデマンド プロファイル キャプチャの両方が含まれます。オンデマンド プロファイル セッションは、ユーザー インターフェースから直接キャプチャすることもできます。
  • コンソールからのオンデマンド プロファイリング: [プロファイル] タブで、 コンソールからオンデマンド プロファイル セッションを直接キャプチャできます。 Google Cloud Google Cloud [新しいプロファイル セッションをキャプチャ] ボタンをクリックし、プロファイル セッションをキャプチャする期間を指定して、プロファイルのキャプチャに必要なホストを選択します。ワークロードを実行しているホストは、手動で入力しなくてもテーブルに自動的に入力されます。指定したオンデマンド キャプチャ時間が経過すると、プロファイル セッションが [セッション] テーブルに自動的に表示されます。