Registrare automaticamente i dati in un'esecuzione dell'esperimento

La registrazione automatica è una funzionalità dell'SDK Vertex AI che registra automaticamente parametri e metriche delle esecuzioni di addestramento dei modelli in Vertex AI Experiments. In questo modo, puoi risparmiare tempo e fatica, perché non devi registrare manualmente questi dati. La registrazione automatica supporta solo la registrazione di parametri e metriche.

Registrare automaticamente i dati

Esistono due opzioni per registrare automaticamente i dati in Vertex AI Experiments.

  1. Consenti all'SDK Vertex AI di creare automaticamente ExperimentRun le risorse.
  2. Specifica la risorsa ExperimentRun in cui vuoi scrivere i parametri registrati automaticamente e le metriche.

Creato automaticamente

L'SDK Agent Platform Python gestisce la creazione delle risorse ExperimentRun. Le risorse ExperimentRun create automaticamente avranno un nome di esecuzione nel seguente formato: {ml-framework-name}-{timestamp}-{uid}, ad esempio: "tensorflow-2023-01-04-16-09-20-86a88".

L'esempio seguente utilizza il metodo init, delle funzioni del aiplatform Package.

Python

from typing import Optional, Union

from google.cloud import aiplatform


def autologging_with_auto_run_creation_sample(
    experiment_name: str,
    project: str,
    location: str,
    experiment_tensorboard: Optional[Union[str, aiplatform.Tensorboard]] = None,
):
    aiplatform.init(
        experiment=experiment_name,
        project=project,
        location=location,
        experiment_tensorboard=experiment_tensorboard,
    )

    aiplatform.autolog()

    # Your model training code goes here

    aiplatform.autolog(disable=True)

  • experiment_name: fornisci un nome per l'esperimento. Puoi trovare il tuo elenco di esperimenti nella Google Cloud console selezionando Esperimenti nella barra di navigazione della sezione.
  • experiment_tensorboard: (facoltativo) fornisci un nome per l'istanza di Vertex AI TensorBoard.
  • project: . Puoi trovare questi ID progetto nella Google Cloud console pagina di benvenuto.
  • location: consulta l'elenco delle località disponibili

Specificato dall'utente

Fornisci i tuoi nomi ExperimentRun e registra le metriche e i parametri di più esecuzioni di addestramento dei modelli nella stessa ExperimentRun. Tutte le metriche del modello per l'esecuzione corrente impostate chiamando aiplatform.start_run("your-run-name") fino a quando aiplatform.end_run() non viene chiamata.

L'esempio seguente utilizza il metodo init, delle funzioni del pacchetto aiplatform .

Python

from typing import Optional, Union

from google.cloud import aiplatform


def autologging_with_manual_run_creation_sample(
    experiment_name: str,
    run_name: str,
    project: str,
    location: str,
    experiment_tensorboard: Optional[Union[str, aiplatform.Tensorboard]] = None,
):
    aiplatform.init(
        experiment=experiment_name,
        project=project,
        location=location,
        experiment_tensorboard=experiment_tensorboard,
    )

    aiplatform.autolog()

    aiplatform.start_run(run=run_name)

    # Your model training code goes here

    aiplatform.end_run()

    aiplatform.autolog(disable=True)

  • experiment_name: fornisci il nome dell'esperimento.
  • run_name: fornisci un nome per l'esecuzione dell'esperimento. Puoi trovare l'elenco degli esperimenti nella Google Cloud console selezionando Esperimenti nella barra di navigazione della sezione.
  • project: . Puoi trovare questi ID progetto nella Google Cloud console benvenuto pagina.
  • location: consulta l'elenco delle località disponibili
  • experiment_tensorboard: (facoltativo) fornisci un nome per l'istanza di Vertex AI TensorBoard.

La registrazione automatica dell'SDK Vertex AI utilizza la registrazione automatica di MLFlow nella sua implementazione. Le metriche e i parametri di valutazione dei seguenti framework vengono registrati in ExperimentRun quando la registrazione automatica è abilitata.

  • Fastai
  • Gluon
  • Keras
  • LightGBM
  • Pytorch Lightning
  • Scikit-learn
  • Spark
  • Statsmodels
  • XGBoost

Visualizzare i parametri e le metriche registrati automaticamente

Utilizza l'SDK Agent Platform Python per confrontare le esecuzioni e ottenere i dati delle esecuzioni. La Google Cloud console offre un modo semplice per confrontare queste esecuzioni.

Esempio di notebook pertinente

Blog post