Bermigrasi dari model klasik ke model Conformer

Untuk meningkatkan akurasi dan performa transkripsi dan pengenalan ucapan, Cloud Speech-to-Text V1 API memperbarui model ucapan klasik yang tersisa ke model berbasis Conformer canggih dengan cara yang tidak merusak fungsi API. Model klasik mengacu pada model yang diekspos di V1 API dengan tanda model command_and_search, default, phone_call, dan video. Model ini didasarkan pada model akustik dan bahasa diskrit serta telah mendukung kasus penggunaan Speech-to-Text API tertentu.

Sejak awal arsitektur Conformer pada tahun 2020 di Google Brain, kami telah menguji solusi kami dan secara bertahap mengganti model Speech-to-Text V1 API kami. Dengan demikian, akurasi, keandalan, dan performa dalam domain telah meningkat di berbagai kasus penggunaan. Di halaman ini, Anda dapat menemukan petunjuk tentang cara mendapatkan manfaat dari migrasi dan cara memilih untuk bermigrasi lebih awal atau lebih lambat, bergantung pada kebutuhan Anda.

Yang berubah

Setelah batas waktu migrasi, kami akan mulai mengalihkan lalu lintas dari model yang saat ini diekspos. ID model ini akan tetap valid dan terus melayani traffic, karena pengalihan terjadi secara internal.

Tabel ini menunjukkan perutean yang akan terjadi saat migrasi diterapkan. Pengalihan akan terjadi di antara ID model yang sudah terlihat. Meskipun tidak wajib, Anda dapat melakukan perubahan kode dan menguji perilaku model kapan saja.

Kode BCP-47 ID model saat ini single_utterance Tujuan pengalihan traffic ID model
en-US command_and_search false latest_long
command_and_search true latest_short
default false telephony
phone_call false telephony
phone_call(use_enhanced=true) true telephony_short
video false telephony
de-DE, en-AU, en-GB, en-IN, es-ES, es-US, fr-CA, fr-FR, it-IT, ja-JP, nl-NL, pt-BR command_and_search false latest_long
command_and_search true latest_short
default false latest_long
phone_call(use_enhanced=true) true latest_short
phone_call false latest_long

Linimasa

Anda memiliki tiga opsi migrasi, yang diuraikan di halaman ini. Pada Januari 2024, kami akan mulai mengalihkan traffic secara bertahap dari model klasik ke model berbasis Conformer project demi project, dengan komunikasi individual sebelum migrasi. Pada Juni 2024, kami akan mengalihkan semua traffic hanya ke model Conformer. Siapa pun yang masih meminta model klasik akan otomatis dialihkan ke model berbasis Conformer yang sesuai.

Mekanisme migrasi

Pelanggan dapat memilih untuk ikut serta lebih awal atau memilih untuk tidak ikut serta dan bermigrasi nanti dengan mengikuti petunjuk berikut:

Disarankan: Memilih ikut serta dan melakukan migrasi lebih awal

Jika Anda ingin memilih ikut serta secara proaktif, ganti ID model yang telah Anda gunakan di Speech-to-Text V1 API dengan ID yang telah diupdate, seperti yang ditunjukkan dalam tabel sebelumnya. Memigrasikan project Anda secara proaktif memberi Anda waktu untuk menguji model dan memanfaatkan peningkatan akurasi dan keandalan lebih awal.

Memilih tidak ikut serta dan melakukan migrasi nanti

Jika Anda menemukan masalah pada model yang diperbarui dan ingin menonaktifkan migrasi untuk sementara, buat Google Cloud kasus dukungan. Saat membuat kasus dukungan, gunakan judul "Memilih tidak ikut migrasi conformer Speech-to-Text" dan berikan project ID Anda serta alasan memilih tidak ikut.