ML Diagnostics で機械学習の実行を表示する
機械学習の実行とは、機械学習スクリプトまたはパイプラインの 1 回の完全な実行のことです。ML Diagnostics を使用すると、 コンソール Google Cloud で機械学習の実行を CLI または SDK を使用して表示できます。
Cluster Director で機械学習の実行をすべて表示するには:
- コンソールで、[Cluster Director] ページに移動します。 Google Cloud
- [実行診断] タブをクリックします。
Google Kubernetes Engine で機械学習の実行をすべて表示するには:
- コンソールで [Kubernetes] ページに移動します。 Google Cloud
- ナビゲーション メニューで [AI/ML] をクリックします。
- [実行診断] タブをクリックします。
Cluster Director と GKE の両方で、次の情報が表示されます。
- 実行の概要: すべての 機械学習の実行の概要情報を含むリストビュー テーブル。
- 実行の詳細: 各実行の実行の詳細(構成や実行情報など)。
- 指標の時系列グラフ: モデル指標、
パフォーマンス指標、システム指標など、すべての指標。これらの指標は、ログ エクスプローラでも確認できます。
metrics.record()メソッドで記録された指標はログエントリとして書き込まれ、フィルタリングしたり、ログベースの指標の作成に使用したりできます。 - プロファイリング情報: 特定の実行のすべてのプロファイル セッションを含む [プロファイル] タブ。XProf ビューアへのリンクがあります。これには、プログラマティック プロファイル キャプチャとオンデマンド プロファイル キャプチャの両方が含まれます。オンデマンド プロファイル セッションは、ユーザー インターフェースから直接キャプチャすることもできます。
- コンソールからのオンデマンド プロファイリング: [プロファイル] タブで、 コンソールからオンデマンド プロファイル セッションを直接キャプチャできます。 Google Cloud Google Cloud [新しいプロファイル セッションをキャプチャ] ボタンをクリックし、プロファイル セッションをキャプチャする期間を指定して、プロファイルのキャプチャに必要なホストを選択します。ワークロードを実行しているホストは、手動で入力しなくてもテーブルに自動的に入力されます。指定したオンデマンド キャプチャ時間が経過すると、プロファイル セッションが [セッション] テーブルに自動的に表示されます。