Sie können vorhandene Logs in Ihre Vertex AI TensorBoard-Instanz hochladen, die durch lokales Training oder Training außerhalb von Vertex AI erstellt wurden, von einem Kollegen erstellt wurden, bei denen es sich um Beispiel-Logs handelt oder die mit einer anderen Vertex AI TensorBoard-Instanz erstellt wurden. Protokolle können für mehrere Vertex AI TensorBoard-Instanzen freigegeben werden.
Vertex AI TensorBoard bietet die Google Cloud CLI und das Vertex AI SDK für Python zum Hochladen von TensorBoard-Logs. Sie können Logs aus jeder Umgebung hochladen, mit der sich eine Verbindung zu Google Cloudherstellen lässt.
Vertex AI SDK für Python
Unterbrechungsfreies Monitoring
Für eine kontinuierliche Überwachung rufen Sie aiplatform.start_upload_tb_log zu Beginn des Trainings an.
Das SDK öffnet einen neuen Thread für den Upload. Dieser Thread überwacht neue Daten im Verzeichnis und lädt sie in Ihren Vertex AI TensorBoard-Test hoch.
Rufen Sie nach Abschluss des Trainings end_upload_tb_log auf, um den Uploader-Thread zu beenden.
Hinweis: Nach dem Aufruf von start_upload_tb_log() bleibt Ihr Thread aktiv, auch wenn eine Ausnahme ausgelöst wird. Damit der Thread heruntergefahren wird, fügen Sie beliebigen Code nach start_upload_tb_log() und vor end_upload_tb_log() in eine try-Anweisung ein und rufen Sie end_upload_tb_log() in finally auf.
Python
tensorboard_experiment_name: Der Name des TensorBoard-Tests, in den hochgeladen werden soll.logdir: Der Verzeichnisstandort, der auf TensorBoard-Logs geprüft werden soll.tensorboard_id: Die TensorBoard-Instanz-ID. Wenn nicht festgelegt, wird dietensorboard_idinaiplatform.initverwendet.project: . Sie finden die Projekt-ID auf der Google Cloud Console-Begrüßungsseite.location: Der Standort, an dem sich Ihre TensorBoard-Instanz befindet.experiment_display_name: Der Anzeigename des Tests.run_name_prefix: Wenn vorhanden, wird dem Namen aller Ausführungen, die durch diesen Aufruf erstellt werden, dieser Wert vorangestellt.description: Eine Stringbeschreibung, die dem Test zugewiesen werden soll.
Einmaliges Logging
TensorBoard-Logs hochladen
aiplatform.upload_tb_log aufrufen, um einen einmaligen Upload von TensorBoard-Logs durchzuführen.
Dadurch werden vorhandene Daten in das Logdir hochgeladen und dann sofort zurückgegeben.
Python
tensorboard_experiment_name: Der Name des TensorBoard-Tests.logdir: Der Verzeichnisstandort, der auf TensorBoard-Logs geprüft werden soll.tensorboard_id: Die TensorBoard-Instanz-ID. Wenn nicht festgelegt, wird dietensorboard_idinaiplatform.initverwendet.project: . Sie finden die Projekt-IDs auf der Begrüßungsseite der Google Cloud Console.location: Der Standort, an dem sich Ihre TensorBoard-Instanz befindet.experiment_display_name: Der Anzeigename des Tests.run_name_prefix: Wenn vorhanden, wird dem Namen aller Ausführungen, die durch diesen Aufruf erstellt werden, dieser Wert vorangestellt.description: Eine Stringbeschreibung, die dem Test zugewiesen werden soll.verbosity: Ausführlichkeitsstufe der Statistiken, eine Ganzzahl. Unterstützter Wert: 0 – Es werden keine Uploadstatistiken ausgegeben. 1 - Uploadstatistiken beim Hochladen von Daten ausgeben (Standardeinstellung).
Profil-Logs hochladen
aiplatform.upload_tb_log aufrufen, um TensorBoard-Profil-Logs in einen Test hochzuladen.
Python
experiment_name: Der Name des TensorBoard-Tests.logdir: Der Verzeichnisstandort, der auf TensorBoard-Logs geprüft werden soll.project: . Sie finden diese Projekt-IDs auf der Begrüßungsseite der Google Cloud Console.location: Der Standort, an dem sich Ihre TensorBoard-Instanz befindet.run_name_prefix: Bei Profildaten ist dies das Laufpräfix. Das Verzeichnisformat in LOG_DIR sollte Folgendem entsprechen:/RUN_NAME_PREFIX/plugins/profile/YYYY_MM_DD_HH_SS/
allowed_plugins: Eine Liste der zusätzlichen Plugins, die zugelassen werden sollen. Beim Hochladen von Profildaten sollte dies"profile"
Befehlszeile
- Optional: Erstellen Sie eine dedizierte virtuelle Umgebung, um die Python-Befehlszeile des Vertex AI TensorBoard-Uploaders zu installieren.
python3 -m venv PATH/TO/VIRTUAL/ENVIRONMENT source PATH/TO/VIRTUAL/ENVIRONMENT/bin/activate
PATH/TO/VIRTUAL/ENVIRONMENT: Ihre eigene virtuelle Umgebung.
- Installieren Sie das Vertex AI TensorBoard-Paket über das Vertex AI SDK.
pip install -U pip pip install google-cloud-aiplatform[tensorboard]
- TensorBoard-Protokolle hochladen
- Zeitreihen- und Blob-Daten
tb-gcp-uploader --tensorboard_resource_name \
TENSORBOARD_RESOURCE_NAME\ --logdir=LOG_DIR\ --experiment_name=TB_EXPERIMENT_NAME--one_shot=True - Profildaten
tb-gcp-uploader \ --tensorboard_resource_name
TENSORBOARD_RESOURCE_NAME\ --logdir=LOG_DIR--experiment_name=TB_EXPERIMENT_NAME\ --allowed_plugins="profile" --run_name_prefix=RUN_NAME_PREFIX\ --one_shot=True
- Zeitreihen- und Blob-Daten
-
TENSORBOARD_RESOURCE_NAME: Der TensorBoard-Ressourcenname, mit dem die Vertex AI TensorBoard-Instanz vollständig identifiziert wird. LOG_DIR: Der Speicherort der Ereignislogs, die sich entweder im lokalen Dateisystem oder in Cloud Storage befindenTB_EXPERIMENT_NAME: Der Name des TensorBoard-Tests, z. B.test-experiment.RUN_NAME_PREFIX: Bei Profildaten ist dies das Laufpräfix. Das Verzeichnisformat inLOG_DIRsollte Folgendem entsprechen:/RUN_NAME_PREFIX/plugins/profile/YYYY_MM_DD_HH_SS/
Die Uploader-Befehlszeile wird standardmäßig unbegrenzt ausgeführt, überwacht die Änderungen in LOG_DIR und lädt neu hinzugefügte Logs hoch. --one_shot=True deaktiviert das Verhalten. Führen Sie tb-gcp-uploader --help aus, um weitere Informationen zu erhalten.