Puedes subir registros existentes a tu instancia de Vertex AI TensorBoard que se crearon mediante un entrenamiento local, un entrenamiento fuera de Vertex AI, que creó un colega, que son registros de ejemplo o que se crearon con una instancia de Vertex AI TensorBoard diferente. Los registros se pueden compartir entre varias instancias de Vertex AI TensorBoard.
Vertex AI TensorBoard ofrece Google Cloud CLI y el SDK de Vertex AI para Python para subir registros de TensorBoard. Puedes subir registros desde cualquier entorno que pueda conectarse a Google Cloud.
SDK de Vertex AI para Python
Supervisión continua
Para la supervisión continua, llama a aiplatform.start_upload_tb_log al comienzo del entrenamiento.
El SDK abre un nuevo subproceso para la carga. Este subproceso supervisa si hay datos nuevos en el directorio y los sube a tu experimento de Vertex AI TensorBoard.
Cuando se complete el entrenamiento, llama a end_upload_tb_log para finalizar el subproceso del cargador.
Ten en cuenta que, después de llamar a start_upload_tb_log(), tu subproceso se mantendrá activo, incluso si se genera una excepción. Para asegurarte de que el subproceso se cierre, coloca cualquier código después de start_upload_tb_log() y antes de end_upload_tb_log() en una sentencia try, y llama a end_upload_tb_log() en finally.
Python
tensorboard_experiment_name: Es el nombre del experimento de TensorBoard al que se subirá.logdir: Es la ubicación del directorio para verificar los registros de TensorBoard.tensorboard_id: Es el ID de la instancia de TensorBoard. Si no se establece, se usa eltensorboard_idenaiplatform.init.project: . Puedes encontrar el ID del proyecto en la página de bienvenida de la Google Cloud consola Google Cloud .location: Es la ubicación en la que se encuentra tu instancia de TensorBoard.experiment_display_name: Es el nombre visible del experimento.run_name_prefix: Si está presente, todos los experimentos creados por esta invocación tendrán este valor como prefijo en su nombre.description: Una descripción de cadena para asignar al experimento.
Registro único
Sube registros de TensorBoard
Llama a aiplatform.upload_tb_log para realizar una carga única de los registros de TensorBoard.
Esto sube los datos existentes en el directorio de registro y, luego, los muestra de inmediato.
Python
tensorboard_experiment_name: Es el nombre del experimento de TensorBoard.logdir: Es la ubicación del directorio para verificar los registros de TensorBoard.tensorboard_id: Es el ID de la instancia de TensorBoard. Si no se establece, se usa eltensorboard_idenaiplatform.init.project: . Puedes encontrar estos IDs de proyecto en la página de bienvenida de la consola de Google Cloud .location: Es la ubicación en la que se encuentra tu instancia de TensorBoard.experiment_display_name: Es el nombre visible del experimento.run_name_prefix: Si está presente, todos los experimentos creados por esta invocación tendrán este valor como prefijo en su nombre.description: Una descripción de cadena para asignar al experimento.verbosity: El nivel de verbosidad de las estadísticas, un número entero. Valores admitidos: 0 - No se imprimen estadísticas de carga. 1 - Imprime estadísticas de carga mientras se suben datos (predeterminado).
Sube registros de perfil
Llama a aiplatform.upload_tb_log para subir los registros de perfil de TensorBoard a un experimento.
Python
experiment_name: Es el nombre del experimento de TensorBoard.logdir: Es la ubicación del directorio para verificar los registros de TensorBoard.project: . Puedes encontrar estos IDs de proyecto en la página de bienvenida de la consola de Google Cloud .location: La ubicación en la que se encuentra tu instancia de TensorBoard.run_name_prefix: En el caso de los datos del perfil, este es el prefijo de ejecución. El formato del directorio dentro de LOG_DIR debe coincidir con el siguiente:/RUN_NAME_PREFIX/plugins/profile/YYYY_MM_DD_HH_SS/
allowed_plugins: Es una lista de complementos adicionales que se permitirán. Para subir datos de perfil, se debe incluir"profile"
CLI
- (Opcional) Crea un entorno virtual dedicado para instalar la CLI de Python del cargador de Vertex AI TensorBoard.
python3 -m venv PATH/TO/VIRTUAL/ENVIRONMENT source PATH/TO/VIRTUAL/ENVIRONMENT/bin/activate
PATH/TO/VIRTUAL/ENVIRONMENT: Es tu entorno virtual dedicado.
- Instala el paquete de Vertex AI TensorBoard mediante el SDK de Vertex AI
pip install -U pip pip install google-cloud-aiplatform[tensorboard]
- Sube registros de TensorBoard.
- Datos de series temporales y BLOB
tb-gcp-uploader --tensorboard_resource_name \
TENSORBOARD_RESOURCE_NAME\ --logdir=LOG_DIR\ --experiment_name=TB_EXPERIMENT_NAME--one_shot=True - Datos de perfil
tb-gcp-uploader \ --tensorboard_resource_name
TENSORBOARD_RESOURCE_NAME\ --logdir=LOG_DIR--experiment_name=TB_EXPERIMENT_NAME\ --allowed_plugins="profile" --run_name_prefix=RUN_NAME_PREFIX\ --one_shot=True
- Datos de series temporales y BLOB
TENSORBOARD_RESOURCE_NAME: El nombre del recurso de TensorBoard que se usa para identificar por completo la instancia de Vertex AI TensorBoard.LOG_DIR: Es la ubicación de los registros de eventos, que se encuentra en el sistema de archivos local o en Cloud Storage.TB_EXPERIMENT_NAME: Es el nombre del experimento de TensorBoard, por ejemplo,test-experiment.RUN_NAME_PREFIX: En el caso de los datos del perfil, este es el prefijo de ejecución. El formato del directorio dentro deLOG_DIRdebe coincidir con el siguiente:/RUN_NAME_PREFIX/plugins/profile/YYYY_MM_DD_HH_SS/
De forma predeterminada, la CLI del cargador se ejecuta de forma indefinida, supervisa los cambios en LOG_DIR y sube los registros recién agregados. --one_shot=True inhabilita el comportamiento. Ejecuta tb-gcp-uploader --help para más información.