Scelta di un metodo di addestramento

Questo documento illustra le principali differenze tra i metodi di addestramento disponibili su Google Cloud. La scelta dipende dalle competenze del tuo team, dal livello di controllo di cui hai bisogno e dalle tue preferenze in termini di infrastruttura.

  • Con AutoML, puoi creare e addestrare un modello con il minimo sforzo tecnico. Puoi utilizzare AutoML per prototipare rapidamente i modelli ed esplorare nuovi set di dati prima di investire nello sviluppo. Ad esempio, puoi utilizzarlo per scoprire quali caratteristiche sono più adatte a un determinato set di dati.

  • Con l'addestramento personalizzato puoi creare un'applicazione di addestramento ottimizzata per i risultati desiderati. Hai il controllo completo sulle funzionalità dell'applicazione di addestramento, dai job con un singolo nodo all'addestramento distribuito su più nodi. ovvero puoi scegliere come target qualsiasi obiettivo, utilizzare qualsiasi algoritmo, sviluppare le tue funzioni di perdita o metriche oppure definire altre personalizzazioni.

    • Addestramento serverless di Vertex AI: si tratta di un approccio serverless in cui invii il job di addestramento e Google Cloud esegue il provisioning, la gestione e il rilascio delle risorse di computing per te. È ideale per gli esperimenti e per i job in cui non è necessaria una capacità garantita.

    • I cluster di addestramento Vertex AI sono una funzionalità dell'addestramento personalizzato progettata per job di addestramento su larga scala e ad alte prestazioni. Consente di prenotare un cluster dedicato di potenti risorse di calcolo (come GPU A100 o H100) per il tuo uso esclusivo, garantendo capacità e prestazioni per attività di addestramento mission-critical e di lunga durata.

  • Con Ray su Vertex AI puoi utilizzare il framework di calcolo distribuito di Ray sull'infrastruttura Google Cloud . Ray su Vertex AI fornisce un ambiente gestito con risorse di calcolo configurabili, integrazione con servizi come Vertex AI Inference e BigQuery e opzioni di networking flessibili per sviluppare ed eseguire carichi di lavoro distribuiti.

  • Utilizzando BigQuery, puoi addestrare i modelli utilizzando i tuoi dati BigQuery direttamente in BigQuery. Utilizzando i comandi SQL, puoi creare rapidamente un modello e utilizzarlo per ottenere inferenze batch.

Per confrontare le diverse funzionalità e competenze richieste per ciascun servizio, consulta la seguente tabella.

AutoML Addestramento serverless Cluster di addestramento Ray su Vertex AI BigQuery ML
Sono richieste competenze di data science No Sì, per sviluppare l'applicazione di addestramento e gestire la preparazione dei dati. Sì, per sviluppare l'applicazione di addestramento e gestire la preparazione dei dati. È utile una comprensione di base dei concetti di ML e dei flussi di lavoro dei dati. No
Sono richieste conoscenze di programmazione No, AutoML è senza codice. Sì, per sviluppare l'applicazione di addestramento. Sì, per sviluppare l'applicazione di addestramento. Sì. Sì.
Tempo per addestrare il modello Minore. È necessaria una minore preparazione dei dati e non è richiesto alcuno sviluppo. Maggiore. Comporta lo sviluppo del codice e il tempo di provisioning delle risorse on demand per ogni job. Maggiore. Implica lo sviluppo del codice, ma l'avvio del job è più rapido perché le risorse sono già riservate, eliminando le code e il tempo di provisioning. Il tempo di addestramento dipende dalla logica del codice (preparazione e addestramento dei dati) e dal tempo necessario per il provisioning delle risorse. Minore. Lo sviluppo del modello è rapido perché BigQuery ML utilizza il motore di calcolo di BigQuery per l'addestramento, la valutazione e l'inferenza.
Limiti degli obiettivi di machine learning Sì. Devi scegliere come target uno degli obiettivi predefiniti di AutoML. No No No
Le prestazioni del modello possono essere migliorate manualmente con l'ottimizzazione degli iperparametri No. AutoML esegue alcune ottimizzazioni automatiche, ma non puoi modificare i valori. Sì. Puoi ottimizzare il modello durante l'esecuzione di ogni addestramento per la sperimentazione e il confronto. Sì. Puoi ottimizzare il modello durante l'esecuzione di ogni addestramento per la sperimentazione e il confronto. Sì. Fornisci il codice di addestramento personalizzato, che ti consente di controllare completamente i valori degli iperparametri. Sì. BigQuery ML supporta l'ottimizzazione degli iperparametri durante l'addestramento dei modelli.
Controllo degli aspetti dell'addestramento personalizzato Limitato. Puoi specificare il budget per le ore di addestramento e attivare l'interruzione anticipata. Sì. Specifichi il tipo di macchina Compute Engine, la dimensione del disco e l'immagine container per ogni job. Sì. Hai il massimo controllo, riservando tipi di macchine specifici ad alte prestazioni (ad es. H100), configurazioni del disco e impostazioni di rete per il tuo uso esclusivo, garantendo la capacità. Sì. Hai un controllo significativo, tra cui immagini Docker personalizzate, tipi di macchine per i nodi head e worker e il numero e il tipo di acceleratori (GPU). No
Limiti delle dimensioni dei dati Sì. I limiti delle dimensioni dei dati variano a seconda del tipo di set di dati. No No No. Tuttavia, esiste una dimensione massima della risposta alla query di 10 GB per le letture BigQuery. Sì. BigQuery ML applica le quote appropriate in base al singolo progetto. Per saperne di più, consulta Quote e limiti.

Passaggi successivi