Dengan menggunakan API, tanpa kode apa pun, Anda dapat membuat dan melatih model Speech-to-Text Kustom untuk meningkatkan akurasi pengenalan dari model Cloud Speech-to-Text yang ada. Layanan terkelola sepenuhnya ini akan otomatis menyediakan resource komputasi, mengeksekusi kode aplikasi pelatihan, dan memastikan penghapusan resource komputasi setelah tugas pelatihan. Anda akan mendapatkan model transkripsi yang sepenuhnya disesuaikan secara mendalam dan berguna untuk aplikasi downstream apa pun.
Mirip dengan model machine learning, pelatihan model Speech-to-Text Kustom biasanya bersifat iteratif dan melibatkan pemilihan model dasar sebagai titik awal, penyesuaiannya secara mendalam dengan set data teks dan audio Anda, lalu pengujian kualitas pengenalan model. Jika hasilnya tidak sesuai dengan yang Anda harapkan, Anda dapat melatih ulang model baru dengan campuran data yang berbeda, mengujinya lagi, atau menggunakannya secara langsung untuk transkripsi di domain Anda.
Sebelum memulai
Pastikan Anda telah mendaftar ke akun Google Cloud , membuat project Google Cloud, dan mengaktifkan Cloud Speech-to-Text API: Buka Speech di konsolGoogle Cloud , lalu buka Cloud Speech-to-Text API. Buka bagian Custom Models di menu navigasi di sebelah kiri.
Membuat model kustom
Mulai dengan membuat model Speech-to-Text kustom dan menentukan parameternya, seperti model dasar dan bahasa transkripsi:
- Klik Create untuk membuat model kustom.
- Masukkan Model name, yang akan digunakan untuk tampilan dan dirujuk dalam permintaan API dan konsol Speech Google Cloud .
- Masukkan Description untuk model.
- Pilih Base model yang paling sesuai untuk kasus penggunaan Anda.
- Pilih Language transkripsi model.
- Pilih Region tempat pelatihan akan dilakukan.
- Klik Continue.
Untuk menyelesaikan definisi tugas model Speech-to-Text Kustom dan memulai pelatihan, Anda harus menentukan set data pelatihan dan validasi.
- Pilih training dataset, dengan memberikan URI direktori Cloud Storage
yang valid. Pastikan hanya file audio dan teks yang ada, dan
total durasi audio mengikuti persyaratan set data pelatihan.
- Pilih validation dataset, dengan memberikan URI direktori Cloud Storage
yang valid. Pastikan hanya file audio dan teks yang ada, dan
total durasi audio mengikuti persyaratan
set data validasi.
- Klik Create untuk memulai proses pelatihan.
- Pilih validation dataset, dengan memberikan URI direktori Cloud Storage
yang valid. Pastikan hanya file audio dan teks yang ada, dan
total durasi audio mengikuti persyaratan
set data validasi.
Jika jam audio yang diindeks tidak cukup atau file tidak mengikuti panduan, tugas pelatihan akan gagal.
Tugas pelatihan dapat diantrekan di belakang tugas lain dalam sistem kami, dan pelatihan model dapat memerlukan waktu mulai dari beberapa jam hingga beberapa hari, bergantung pada ukuran set data. Setelah pelatihan model, statusnya akan ditandai sebagai Active.
Menghapus model kustom
Sebelum memulai, pastikan tidak ada traffic yang dirutekan ke model Speech-to-Text Kustom Anda melalui endpoint mana pun. Jika dihapus, endpoint tersebut tidak akan lagi memproses permintaan apa pun.
- Buka tab Models di bagian Custom Models.
- Klik untuk meluaskan opsi, lalu klik Delete. Dalam beberapa saat, model Speech-to-Text Kustom akan dihapus, beserta semua endpointnya, dan tidak akan lagi memproses traffic.
Mencantumkan model kustom Anda
Dengan memilih Models di bagian Custom Models, Anda juga dapat mencantumkan semua model Speech-to-Text Kustom, termasuk model yang dilatih, aktif, dan dihapus.
Langkah berikutnya
Ikuti referensi berikut untuk memanfaatkan model ucapan kustom dalam aplikasi Anda: