Untuk meningkatkan akurasi dan performa transkripsi dan pengenalan ucapan, Cloud Speech-to-Text V1 API memperbarui model ucapan klasik yang tersisa ke model berbasis Conformer canggih dengan cara yang tidak merusak fungsi API. Model klasik mengacu pada model yang diekspos di V1 API dengan tanda model command_and_search, default, phone_call, dan video. Model ini didasarkan pada model akustik dan bahasa diskrit serta telah mendukung kasus penggunaan Speech-to-Text API tertentu.
Sejak awal arsitektur Conformer pada tahun 2020 di Google Brain, kami telah menguji solusi kami dan secara bertahap mengganti model Speech-to-Text V1 API kami. Dengan demikian, akurasi, keandalan, dan performa dalam domain telah meningkat di berbagai kasus penggunaan. Di halaman ini, Anda dapat menemukan petunjuk tentang cara mendapatkan manfaat dari migrasi dan cara memilih untuk bermigrasi lebih awal atau lebih lambat, bergantung pada kebutuhan Anda.
Yang berubah
Setelah batas waktu migrasi, kami akan mulai mengalihkan lalu lintas dari model yang saat ini diekspos. ID model ini akan tetap valid dan terus melayani traffic, karena pengalihan terjadi secara internal.
Tabel ini menunjukkan perutean yang akan terjadi saat migrasi diterapkan. Pengalihan akan terjadi di antara ID model yang sudah terlihat. Meskipun tidak wajib, Anda dapat melakukan perubahan kode dan menguji perilaku model kapan saja.
| Kode BCP-47 | ID model saat ini | single_utterance | Tujuan pengalihan traffic ID model |
|---|---|---|---|
| en-US | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
telephony |
|
phone_call |
false |
telephony |
|
phone_call(use_enhanced=true) |
true |
telephony_short |
|
video |
false |
telephony |
|
| de-DE, en-AU, en-GB, en-IN, es-ES, es-US, fr-CA, fr-FR, it-IT, ja-JP, nl-NL, pt-BR | command_and_search |
false |
latest_long |
command_and_search |
true |
latest_short |
|
default |
false |
latest_long |
|
phone_call(use_enhanced=true) |
true |
latest_short |
|
phone_call |
false |
latest_long |
Linimasa
Anda memiliki tiga opsi migrasi, yang diuraikan di halaman ini. Pada Januari 2024, kami akan mulai mengalihkan traffic secara bertahap dari model klasik ke model berbasis Conformer project demi project, dengan komunikasi individual sebelum migrasi. Pada Juni 2024, kami akan mengalihkan semua traffic hanya ke model Conformer. Siapa pun yang masih meminta model klasik akan otomatis dialihkan ke model berbasis Conformer yang sesuai.
Mekanisme migrasi
Pelanggan dapat memilih untuk ikut serta lebih awal atau memilih untuk tidak ikut serta dan bermigrasi nanti dengan mengikuti petunjuk berikut:
Disarankan: Memilih ikut serta dan melakukan migrasi lebih awal
Jika Anda ingin memilih ikut serta secara proaktif, ganti ID model yang telah Anda gunakan di Speech-to-Text V1 API dengan ID yang telah diupdate, seperti yang ditunjukkan dalam tabel sebelumnya. Memigrasikan project Anda secara proaktif memberi Anda waktu untuk menguji model dan memanfaatkan peningkatan akurasi dan keandalan lebih awal.
Memilih tidak ikut serta dan melakukan migrasi nanti
Jika Anda menemukan masalah pada model yang diperbarui dan ingin menonaktifkan migrasi untuk sementara, buat Google Cloud kasus dukungan. Saat membuat kasus dukungan, gunakan judul "Memilih tidak ikut migrasi conformer Speech-to-Text" dan berikan project ID Anda serta alasan memilih tidak ikut.