Membuat audio dari teks menggunakan command line
Dokumen ini akan memandu Anda melalui proses pengajuan permintaan ke Text-to-Speech menggunakan command line. Untuk mempelajari lebih lanjut konsep dasar dalam Text-to-Speech, baca Dasar-Dasar Text-to-Speech.
Sebelum memulai
Sebelum dapat mengirim permintaan ke Text-to-Speech API, Anda harus menyelesaikan tindakan berikut terlebih dahulu. Lihat halaman sebelum memulai untuk mengetahui detailnya.
- Aktifkan Text-to-Speech di project GCP.
- Pastikan penagihan diaktifkan untuk Text-to-Speech.
-
Instal Google Cloud CLI. Setelah penginstalan, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud initJika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.
Menyintesis audio dari teks
Anda dapat mengonversi teks menjadi audio dengan mengajukan permintaan POST HTTP ke
endpoint https://texttospeech.googleapis.com/v1/text:synthesize. Dalam
isi perintah POST, tentukan jenis suara yang akan disintesis
di bagian konfigurasi voice, tentukan teks yang akan disintesis di
kolom text dari bagian input, lalu tentukan jenis audio yang akan dibuat
di bagian audioConfig.
Jalankan permintaan REST di bawah ini pada command line untuk menyintesis audio dari teks menggunakan Text-to-Speech. Perintah ini menggunakan perintah
gcloud auth application-default print-access-tokenuntuk mengambil token otorisasi untuk permintaan tersebut.Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: ID alfanumerik Google Cloud project Anda.
Metode HTTP dan URL:
POST https://texttospeech.googleapis.com/v1/text:synthesize
Isi permintaan dalam format JSON:
{ "input": { "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets." }, "voice": { "languageCode": "en-gb", "name": "en-GB-Standard-A", "ssmlGender": "FEMALE" }, "audioConfig": { "audioEncoding": "MP3" } }Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima respons JSON yang mirip dengan contoh berikut:
{ "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.." }Output JSON untuk perintah REST berisi audio yang disintesis dalam format berenkode base64. Salin konten kolom
audioContentke file baru bernamasynthesize-output-base64.txt. File baru Anda akan terlihat seperti berikut://NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o ... VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
Dekode konten file
synthesize-output-base64.txtmenjadi file baru bernamasynthesized-audio.mp3. Untuk mengetahui informasi tentang cara mendekode base64, lihat Mendekode Konten Audio Berenkode Base64.Linux
Hanya salin konten berenkode base-64 ke dalam file teks.
Dekode file teks sumber dengan alat command line base64 menggunakan flag
-d:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
Hanya salin konten berenkode base-64 ke dalam file teks.
Dekode file teks sumber menggunakan alat command line base64:
$ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
Hanya salin konten berenkode base-64 ke dalam file teks.
Dekode file teks sumber menggunakan perintah
certutil.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
Putar konten
synthesized-audio.mp3di aplikasi audio atau di perangkat audio. Anda juga dapat membukasynthesized-audio.mp3di browser Chrome untuk memutar audio dengan membuka folder yang berisi file tersebut, misalnyafile://my_file_path/synthesized-audio.mp3
Pembersihan
Untuk menghindari tagihan Google Cloud Platform yang tidak diinginkan, gunakan Google Cloud console untuk menghapus project Anda jika tidak lagi diperlukan.
Langkah berikutnya
- Pelajari lebih lanjut Cloud Text-to-Speech dengan membaca dasar-dasarnya.
- Tinjau daftar suara yang tersedia yang dapat Anda gunakan untuk ucapan sintetis.