Registrare automaticamente i dati in un'esecuzione dell'esperimento

La registrazione automatica è una funzionalità dell'SDK Vertex AI che registra automaticamente parametri e metriche delle sessioni di addestramento dei modelli in Vertex AI Experiments. In questo modo risparmierai tempo e fatica, perché non dovrai registrare manualmente questi dati. La registrazione automatica supporta solo la registrazione di parametri e metriche.

Registra automaticamente i dati

Esistono due opzioni per la registrazione automatica dei dati in Vertex AI Experiments.

  1. Consenti all'SDK Vertex AI di creare automaticamente ExperimentRun le risorse.
  2. Specifica la risorsa ExperimentRun in cui vuoi scrivere i parametri registrati automaticamente e le metriche.

Creato automaticamente

L'SDK Vertex AI Python gestisce la creazione delle risorse ExperimentRun. Le risorse ExperimentRun create automaticamente avranno un nome di esecuzione nel seguente formato: {ml-framework-name}-{timestamp}-{uid}, ad esempio: "tensorflow-2023-01-04-16-09-20-86a88".

L'esempio seguente utilizza il metodo init, delle funzioni del aiplatform Package.

Python

from typing import Optional, Union

from google.cloud import aiplatform


def autologging_with_auto_run_creation_sample(
    experiment_name: str,
    project: str,
    location: str,
    experiment_tensorboard: Optional[Union[str, aiplatform.Tensorboard]] = None,
):
    aiplatform.init(
        experiment=experiment_name,
        project=project,
        location=location,
        experiment_tensorboard=experiment_tensorboard,
    )

    aiplatform.autolog()

    # Your model training code goes here

    aiplatform.autolog(disable=True)

  • experiment_name: fornisci un nome per l'esperimento. Puoi trovare il tuo elenco di esperimenti nella Google Cloud console selezionando Esperimenti nella barra di navigazione della sezione.
  • experiment_tensorboard: (facoltativo) fornisci un nome per l'istanza di Vertex AI TensorBoard.
  • project: . Puoi trovare questi ID progetto nella Google Cloud console pagina di benvenuto.
  • location: consulta l'elenco delle località disponibili

Specificato dall'utente

Fornisci i tuoi nomi ExperimentRun e registra metriche e parametri di più esecuzioni di addestramento dei modelli nella stessa ExperimentRun. Tutte le metriche del modello per l'esecuzione corrente impostate chiamando aiplatform.start_run("your-run-name") fino a quando aiplatform.end_run() non viene chiamata.

L'esempio seguente utilizza il metodo init, delle funzioni del pacchetto aiplatform .

Python

from typing import Optional, Union

from google.cloud import aiplatform


def autologging_with_manual_run_creation_sample(
    experiment_name: str,
    run_name: str,
    project: str,
    location: str,
    experiment_tensorboard: Optional[Union[str, aiplatform.Tensorboard]] = None,
):
    aiplatform.init(
        experiment=experiment_name,
        project=project,
        location=location,
        experiment_tensorboard=experiment_tensorboard,
    )

    aiplatform.autolog()

    aiplatform.start_run(run=run_name)

    # Your model training code goes here

    aiplatform.end_run()

    aiplatform.autolog(disable=True)

  • experiment_name: fornisci il nome dell'esperimento.
  • run_name: fornisci un nome per l'esecuzione dell'esperimento. Puoi trovare l'elenco degli esperimenti nella Google Cloud console selezionando Esperimenti nella barra di navigazione della sezione.
  • project: . Puoi trovare questi ID progetto nella Google Cloud console benvenuto pagina.
  • location: consulta l'elenco delle località disponibili
  • experiment_tensorboard: (facoltativo) fornisci un nome per l'istanza di Vertex AI TensorBoard.

La registrazione automatica dell'SDK Vertex AI utilizza la registrazione automatica di MLFlow nella sua implementazione. Le metriche e i parametri di valutazione dei seguenti framework vengono registrati in ExperimentRun quando la registrazione automatica è abilitata.

  • Fastai
  • Gluon
  • Keras
  • LightGBM
  • Pytorch Lightning
  • Scikit-learn
  • Spark
  • Statsmodels
  • XGBoost

Visualizza parametri e metriche registrati automaticamente

Utilizza l'SDK Vertex AI Python per confrontare le esecuzioni e ottenere i dati delle esecuzioni. La Google Cloud console offre un modo semplice per confrontare queste esecuzioni.

Esempio di notebook pertinente

Blog post