Anda dapat meningkatkan akurasi hasil transkripsi yang diperoleh dari Cloud Speech-to-Text menggunakan adaptasi model. Dengan adaptasi model, Anda dapat menentukan kata dan frasa yang akan lebih sering dikenali oleh Cloud STT dalam data audio Anda, dibandingkan alternatif lain yang mungkin disarankan. Adaptasi model sangat berguna untuk meningkatkan akurasi transkripsi dalam kasus penggunaan berikut:
- Audio Anda berisi kata atau frasa yang mungkin sering muncul.
- Audio Anda kemungkinan berisi kata-kata yang jarang digunakan (seperti nama diri) atau kata-kata yang tidak ada dalam penggunaan umum.
- Audio Anda berisi derau atau tidak terlalu jelas.
Sebelum membaca dokumen ini, baca Pengantar adaptasi model untuk mengetahui ringkasan tingkat tinggi tentang cara kerja fitur ini. Untuk mengetahui informasi tentang batas frasa dan karakter per permintaan adaptasi model, lihat Kuota dan batas.
Contoh kode
Adaptasi model adalah konfigurasi Cloud STT opsional yang dapat Anda gunakan untuk menyesuaikan hasil transkripsi sesuai kebutuhan. Lihat dokumentasi RecognitionConfig untuk informasi selengkapnya tentang cara mengonfigurasi isi permintaan pengenalan.
Contoh kode berikut menunjukkan cara meningkatkan akurasi transkripsi menggunakan resource
SpeechAdaptation:
PhraseSet,
CustomClass,
dan peningkatan adaptasi model.
Untuk menggunakan PhraseSet atau CustomClass dalam permintaan berikutnya, catat name resource-nya, yang ditampilkan dalam respons saat Anda membuat resource tersebut.
Untuk mengetahui daftar class bawaan yang tersedia untuk bahasa Anda, lihat Token class yang didukung.
Python
Untuk mempelajari cara menginstal dan menggunakan library klien untuk Cloud STT, lihat library klien Cloud STT. Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Cloud STT.
Untuk melakukan autentikasi ke Cloud STT, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.