Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Hello tabular data: crea un set di dati e addestra un modello di classificazione AutoML

Utilizza la console Google Cloud per creare un set di dati tabulare e addestrare un modello di classificazione.

Crea un set di dati tabulare

Nella console Google Cloud , nella sezione Agent Platform, vai alla pagina Set di dati.

Vai alla pagina Set di dati
Fai clic su Crea nella barra dei pulsanti per creare un nuovo set di dati.
Inserisci Structured_AutoML_Tutorial come nome del set di dati e seleziona la scheda Tabellare.
Seleziona l'obiettivo Regressione/classificazione.

Lascia il campo Regione impostato su us-central1.
Fai clic su Crea per creare il set di dati.

Per questo tutorial, utilizzerai un set di dati bancari disponibile pubblicamente e ospitato su Cloud Storage.
Per Seleziona un'origine dati, fai clic su Seleziona file CSV da Cloud Storage.
In Percorso file di importazione, inserisci cloud-ml-tables-data/bank-marketing.csv
Fai clic su Continua.

Analizza il set di dati

Nella sezione Analizza puoi visualizzare ulteriori informazioni sul set di dati, ad esempio i valori mancanti o NULL.

Poiché il nostro set di dati è formattato correttamente per questo tutorial, non devi fare nulla in questa pagina e puoi saltare questa sezione.

(Facoltativo) Fai clic su Genera statistiche per visualizzare il numero di valori mancanti o NULL nel set di dati. Questa operazione può richiedere 10 minuti o più.
(Facoltativo) Fai clic su una delle colonne funzionalità per scoprire di più sui valori dei dati.

Addestra un modello di classificazione AutoML

Fai clic su Addestra nuovo modello.
Seleziona Altro.
Nel riquadro Metodo di addestramento, verifica che il set di dati che hai creato in precedenza sia selezionato per il campo Set di dati.
Nel campo Obiettivo, seleziona Classificazione.
Conferma che sia selezionato il metodo di addestramento AutoML.
Fai clic su Continua.
Nel riquadro Dettagli modello, seleziona Deposito per la colonna target e fai clic su Continua.

La colonna target si riferisce all'aspetto che il modello deve essere addestrato a prevedere. Per il set di dati bank-marketing.csv, la colonna Deposit indica se il cliente ha acquistato un deposito di termine (2 = sì, 1 = no).

Il riquadro Opzioni di addestramento ti offre l'opportunità di aggiungere funzionalità e trasformare i dati delle colonne. Se non è selezionata nessuna colonna, per impostazione predefinita tutte le colonne non target verranno utilizzate come funzionalità per l'addestramento. Questo set di dati è pronto per essere utilizzato, perciò non è necessario applicare alcuna trasformazione.
Fai clic su Continua.
Nel riquadro Compute e prezzi, inserisci 1 per il budget di addestramento.

Il budget di addestramento è il tempo massimo (può variare leggermente) che il modello dedica all'addestramento. Questo valore viene moltiplicato per il prezzo per ora nodo per calcolare il costo totale dell'addestramento. Un numero maggiore di ore di addestramento produce un modello più accurato (fino a un certo punto), ma comporta un costo più elevato. Per scopi di sviluppo, un budget basso va bene, ma per la produzione è importante trovare un equilibrio tra costo e precisione.
Fai clic su Inizia addestramento.

Al termine dell'addestramento, il modello viene visualizzato nella scheda Modello come link attivo, con un'icona di stato con segno di spunta verde.

Passaggi successivi

Ha inizio l'addestramento del modello, il che può richiedere un'ora o più tempo. Riceverai un'email al termine dell'addestramento. Una volta completato l'addestramento del modello, segui le istruzioni riportate nella pagina successiva di questo tutorial per eseguire il deployment del modello e richiedere una previsione.

Questo tutorial utilizza un set di dati di cui è stata eseguita la pulizia e che è stato formattato per l'addestramento AutoML, ma la maggior parte dei dati richiederà alcune operazioni prima di essere pronto per l'uso. La qualità dei dati di addestramento influisce sull'efficacia dei modelli creati. Scopri di più sulla preparazione dei dati.

L'ottenimento dei dati e la loro preparazione sono fondamentali per garantire un modello di machine learning accurato. Scopri di più sulle best practice.

Scopri di più sulla creazione di un set di dati tabellare.

Gemini Enterprise Agent Platform offre due metodi di addestramento dei modelli: AutoML e personalizzato. AutoML consente addestrare i modelli con meno sforzo e mediante il machine learning, mentre il metodo personalizzato offre il controllo completo sulla funzionalità di addestramento. Scopri di più sui metodi di addestramento.

Gemini Enterprise Agent Platform esamina il tipo di dati di origine e i valori della funzionalità, quindi deduce come utilizzerà la funzionalità nell'addestramento del modello. Ti consigliamo di controllare il tipo di dati di ogni colonna per verificare che sia stato interpretato correttamente. Se necessario, puoi specificare una trasformazione supportata diversa per ogni funzionalità. Scopri di più sulle trasformazioni.

Scopri di più sull'addestramento di un modello AutoML per la classificazione o la regressione.

Indietro

Configurazione del progetto e dell'ambiente

Avanti

Deployment di un modello e richiesta di un'inferenza

Hello tabular data: crea un set di dati e addestra un modello di classificazione AutoML Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Crea un set di dati tabulare

Analizza il set di dati

Addestra un modello di classificazione AutoML

Passaggi successivi

Hello tabular data: crea un set di dati e addestra un modello di classificazione AutoML