Utilizza la console Google Cloud per creare un set di dati tabulare e addestrare un modello di classificazione.
Crea un set di dati tabulare
Nella console Google Cloud , nella sezione Agent Platform, vai alla pagina Set di dati.
Fai clic su Crea nella barra dei pulsanti per creare un nuovo set di dati.
Inserisci
Structured_AutoML_Tutorialcome nome del set di dati e seleziona la scheda Tabellare.Seleziona l'obiettivo Regressione/classificazione.
Lascia il campo Regione impostato su us-central1.
Fai clic su Crea per creare il set di dati.
Per questo tutorial, utilizzerai un set di dati bancari disponibile pubblicamente e ospitato su Cloud Storage.
Per Seleziona un'origine dati, fai clic su Seleziona file CSV da Cloud Storage.
In Percorso file di importazione, inserisci
cloud-ml-tables-data/bank-marketing.csvFai clic su Continua.
Analizza il set di dati
Nella sezione Analizza puoi visualizzare ulteriori informazioni sul set di dati, ad esempio i valori mancanti o NULL.
Poiché il nostro set di dati è formattato correttamente per questo tutorial, non devi fare nulla in questa pagina e puoi saltare questa sezione.
(Facoltativo) Fai clic su Genera statistiche per visualizzare il numero di valori mancanti o NULL nel set di dati. Questa operazione può richiedere 10 minuti o più.
(Facoltativo) Fai clic su una delle colonne delle funzionalità per scoprire di più sui valori dei dati.
Addestra un modello di classificazione AutoML
Fai clic su Addestra nuovo modello.
Seleziona Altro.
Nel riquadro Metodo di addestramento, verifica che il set di dati che hai creato in precedenza sia selezionato per il campo Set di dati.
Nel campo Obiettivo, seleziona Classificazione.
Conferma che sia selezionato il metodo di addestramento AutoML.
Fai clic su Continua.
Nel riquadro Dettagli modello, seleziona Deposito per la colonna target e fai clic su Continua.
La colonna target si riferisce all'aspetto che il modello deve essere addestrato a prevedere. Per il set di dati
bank-marketing.csv, la colonnaDepositindica se il cliente ha acquistato un deposito di termine (2 = sì, 1 = no).Il riquadro Opzioni di addestramento ti offre l'opportunità di aggiungere funzionalità e trasformare i dati delle colonne. Se non è selezionata nessuna colonna, per impostazione predefinita tutte le colonne non target verranno utilizzate come funzionalità per l'addestramento. Questo set di dati è pronto per essere utilizzato, perciò non è necessario applicare alcuna trasformazione.
Fai clic su Continua.
Nel riquadro Compute e prezzi, inserisci
1per il budget di addestramento.Il budget di addestramento è il tempo massimo (può variare leggermente) che il modello dedica all'addestramento. Questo valore viene moltiplicato per il prezzo per ora nodo per calcolare il costo totale dell'addestramento. Un numero maggiore di ore di addestramento produce un modello più accurato (fino a un certo punto), ma comporta un costo più elevato. Per scopi di sviluppo, un budget basso va bene, ma per la produzione è importante trovare un equilibrio tra costi e precisione.
Fai clic su Inizia addestramento.
Al termine dell'addestramento, il modello viene visualizzato nella scheda Modello come link attivo, con un'icona di stato con segno di spunta verde.
Passaggi successivi
Ha inizio l'addestramento del modello, il che può richiedere un'ora o più tempo. Riceverai un'email al termine dell'addestramento. Una volta completato l'addestramento del modello, segui le istruzioni riportate nella pagina successiva di questo tutorial per eseguire il deployment del modello e richiedere una previsione.
Questo tutorial utilizza un set di dati di cui è stata eseguita la pulizia e che è stato formattato per l'addestramento AutoML, ma la maggior parte dei dati richiederà alcune operazioni prima di essere pronto per l'uso. La qualità dei dati di addestramento influisce sull'efficacia dei modelli creati. Scopri di più sulla preparazione dei dati.
L'ottenimento dei dati e la loro preparazione sono fondamentali per garantire un modello di machine learning accurato. Scopri di più sulle best practice.
Scopri di più sulla creazione di un set di dati tabellare.
Gemini Enterprise Agent Platform offre due metodi di addestramento dei modelli: AutoML e personalizzato. AutoML consente addestrare i modelli con meno sforzo e mediante il machine learning, mentre l'addestramento personalizzato offre il controllo completo sulla funzionalità di addestramento. Scopri di più sui metodi di addestramento.
Gemini Enterprise Agent Platform esamina il tipo di dati di origine e i valori della funzionalità, quindi deduce come utilizzerà la funzionalità nell'addestramento del modello. Consigliamo di controllare ogni tipo di dati per ciascuna colonna al fine di verificare che sia stato interpretato correttamente. Se necessario, puoi specificare una trasformazione supportata diversa per ogni funzionalità. Scopri di più sulle trasformazioni.
Scopri di più sull'addestramento di AutoML per la classificazione o la regressione.