Memilih metode pelatihan

Dokumen ini menjelaskan perbedaan utama antara metode pelatihan yang tersedia di Google Cloud. Pilihan Anda bergantung pada keahlian tim Anda, tingkat kontrol yang Anda butuhkan, dan preferensi infrastruktur Anda.

  • Dengan AutoML, Anda dapat membuat dan melatih model dengan sedikit upaya teknis. Anda dapat menggunakan AutoML untuk membuat prototipe model dengan cepat dan mempelajari set data baru sebelum berinvestasi dalam pengembangan. Misalnya, Anda dapat menggunakannya untuk mempelajari fitur yang terbaik untuk set data tertentu.

  • Dengan pelatihan kustom, Anda dapat membuat aplikasi pelatihan yang dioptimalkan untuk hasil yang Anda targetkan. Anda memiliki kontrol penuh atas fungsionalitas aplikasi pelatihan, mulai dari tugas node tunggal hingga pelatihan terdistribusi multi-node yang besar. Artinya, Anda dapat menargetkan objektif apa pun, menggunakan algoritma apa pun, mengembangkan fungsi atau metrik kerugian Anda sendiri, atau melakukan penyesuaian lainnya.

    • Pelatihan serverless Vertex AI: Ini adalah pendekatan serverless di mana Anda mengirimkan tugas pelatihan dan Google Cloud menyediakan, mengelola, dan merilis resource komputasi untuk Anda. Jenis ini ideal untuk eksperimen dan untuk tugas yang tidak memerlukan kapasitas terjamin.

    • Cluster pelatihan Vertex AI adalah fitur dalam pelatihan kustom yang dirancang untuk tugas pelatihan berskala besar dan berperforma tinggi. Fitur ini memungkinkan Anda mencadangkan cluster khusus resource komputasi yang canggih (seperti GPU A100 atau H100) untuk penggunaan eksklusif Anda, sehingga menjamin kapasitas dan performa untuk tugas pelatihan yang penting dan berjalan lama.

  • Dengan Ray on Vertex AI, Anda dapat menggunakan framework komputasi terdistribusi Ray di infrastruktur Google Cloud . Ray on Vertex AI menyediakan lingkungan terkelola dengan resource komputasi yang dapat dikonfigurasi, integrasi dengan layanan seperti Inferensi Vertex AI dan BigQuery, serta opsi jaringan yang fleksibel untuk mengembangkan dan menjalankan workload terdistribusi.

  • Dengan BigQuery, Anda dapat melatih model menggunakan data BigQuery secara langsung di BigQuery. Dengan menggunakan perintah SQL, Anda dapat dengan cepat membuat model dan menggunakannya untuk mendapatkan inferensi batch.

Untuk membandingkan berbagai fungsi dan keahlian yang diperlukan untuk setiap layanan, tinjau tabel berikut.

AutoML Pelatihan tanpa server Cluster pelatihan Ray on Vertex AI BigQuery ML
Diperlukan keahlian data science Tidak Ya, untuk mengembangkan aplikasi pelatihan dan menangani penyiapan data. Ya, untuk mengembangkan aplikasi pelatihan dan menangani penyiapan data. Pemahaman dasar tentang konsep ML dan alur kerja data akan bermanfaat. Tidak
Diperlukan kemampuan pemrograman Tidak. AutoML tidak memerlukan kode. Ya, untuk mengembangkan aplikasi pelatihan. Ya, untuk mengembangkan aplikasi pelatihan. Ya. Ya.
Waktu untuk melatih model Lebih sedikit. Memerlukan lebih sedikit persiapan data dan tidak memerlukan pengembangan. Lebih banyak. Melibatkan pengembangan kode dan waktu penyediaan resource sesuai permintaan untuk setiap tugas. Lebih banyak. Melibatkan pengembangan kode, tetapi startup tugas lebih cepat karena resource sudah dicadangkan, sehingga tidak perlu mengantre dan menunggu waktu penyediaan. Waktu untuk melakukan pelatihan bergantung pada logika kode (penyiapan dan pelatihan data) serta waktu untuk menyediakan resource. Lebih sedikit. Pengembangan model menjadi cepat karena BigQuery ML memanfaatkan mesin komputasi BigQuery untuk pelatihan, evaluasi, dan inferensi.
Batas untuk tujuan machine learning Ya. Anda harus menargetkan salah satu tujuan yang telah ditentukan AutoML. Tidak Tidak Tidak Ya
Dapat mengoptimalkan performa model secara manual dengan penyesuaian hyperparameter Tidak. AutoML melakukan beberapa penyesuaian otomatis, tetapi Anda tidak dapat mengubah nilai. Ya. Anda dapat menyesuaikan model dalam setiap pelatihan yang dijalankan untuk eksperimen dan perbandingan. Ya. Anda dapat menyesuaikan model dalam setiap pelatihan yang dijalankan untuk eksperimen dan perbandingan. Ya. Anda menyediakan kode pelatihan kustom, sehingga Anda memiliki kontrol penuh atas nilai hyperparameter. Ya. BigQuery ML mendukung penyesuaian hyperparameter saat melatih model.
Dapat mengontrol aspek lingkungan pelatihan Terbatas. Anda dapat menentukan anggaran untuk jam pelatihan dan mengaktifkan penghentian awal. Ya. Anda menentukan jenis mesin Compute Engine, ukuran disk, dan image container untuk setiap tugas. Ya. Anda memiliki kontrol maksimum, dengan mencadangkan jenis mesin berperforma tinggi tertentu (misalnya, H100), konfigurasi disk, dan setelan jaringan untuk penggunaan eksklusif Anda, sehingga menjamin kapasitas. Ya. Anda memiliki kontrol yang signifikan, termasuk image Docker kustom, jenis mesin untuk node head dan worker, serta jumlah dan jenis akselerator (GPU). Tidak
Batas untuk ukuran data Ya. Batasan ukuran data bervariasi bergantung pada jenis set data. Tidak Tidak Tidak. Namun, ada ukuran respons kueri maksimum sebesar 10 GB untuk pembacaan BigQuery. Ya. BigQuery ML menerapkan kuota yang sesuai per project. Untuk mempelajari lebih lanjut, lihat Kuota dan batas.

Langkah berikutnya