Membuat model terjemahan khusus
Latih dan gunakan model terjemahan kustom dengan menggunakan konsol Google Cloud . Contoh berikut menggunakan AutoML Translation untuk melatih model terjemahan bahasa Inggris ke Spanyol dengan menggunakan set data yang berisi pasangan segmen berorientasi teknologi yang diperoleh dari pelokalan software.
Sebelum memulai
Sebelum dapat mulai menggunakan AutoML Translation, project Anda harus mengaktifkan Cloud Translation API, dan Anda harus memiliki izin yang diberikan oleh peran berikut:
- Peran Viewer untuk melihat resource yang ada di project Anda
- Peran Editor Cloud Translation API untuk membuat dan mengelola set data dan model
- Peran Admin Penyimpanan untuk mengupload data pelatihan ke bucket Cloud Storage
Membuat set data terjemahan dan mengimpor pasangan segmen
Download file arsip yang berisi data sampel untuk melatih model, lalu ekstrak filenya.
Untuk tutorial ini, Anda akan menggunakan file TSV bahasa Inggris ke bahasa Spanyol.
Buka konsol AutoML Translation.
Dari panel navigasi, klik Set Data untuk membuka halaman Set Data.
Klik Create dataset.
Dalam dialog Buat Set Data, tentukan detail tentang set data:
- Masukkan
tutorial_datasetsebagai nama set data. - Pilih Inggris (EN) sebagai bahasa sumber dari menu drop-down.
- Pilih Spanyol (ES) sebagai bahasa target.
- Klik Buat.
- Masukkan
Setelah set data dibuat, klik nama set data untuk melihat detailnya.
Buka tab Impor, lalu upload set data
en-es.tsvke Cloud Storage:- Pilih Upload file dari komputer.
- Klik Pilih file, lalu pilih file
en-es.tsvyang sebelumnya telah Anda download dan ekstrak. - Klik Jelajahi untuk memilih atau membuat bucket Cloud Storage baru
tempat TSV akan disimpan. Region bucket harus
us-central1.
Klik Lanjutkan.
AutoML Translation secara otomatis akan membagi data Anda menjadi set pelatihan, validasi, dan pengujian. Anda dapat melihat pembagian ini dan pasangan kalimat yang telah diimpor di tab Kalimat dari set data Anda.
Melatih model
Buka konsol AutoML Translation.
Dari panel navigasi, buka halaman Set Data.
Klik set data tutorial_dataset.
Buka tab Pelatihan.
Klik Mulai pelatihan untuk membuka panel Latih model baru.
Masukkan
tutorial_modeluntuk nama model.Klik Start training.
Proses pelatihan model dapat memakan waktu beberapa jam hingga selesai.
Mengevaluasi model
Periksa untuk melihat perbandingan model tersebut dengan model Google NMT default yang didasarkan pada pasangan segmen dari set pengujian Anda.
Buka konsol AutoML Translation.
Dari panel navigasi, buka halaman Model.
Klik model tutorial_model.
Klik tab Evaluasi.
Di bagian Evaluasi sebelumnya, Cloud Translation akan menampilkan skor BLEU untuk model Anda yang dibandingkan dengan model Google NMT. Skor BLEU (Bilingual Evaluation Understudy) menunjukkan seberapa mirip teks kandidat dengan teks referensi; nilai yang mendekati angka 100 mewakili teks yang lebih serupa.
Menggunakan model terjemahan
Dari konsol Google Cloud , Anda dapat menggunakan model kustom Anda untuk menerjemahkan beberapa teks.
Buka konsol AutoML Translation.
Dari panel navigasi, buka halaman Model.
Klik model tutorial_model.
Klik tab Prediksi.
Di kotak teks Inggris, masukkan teks yang ingin diterjemahkan, lalu klik Terjemahkan.
Anda dapat membandingkan hasil dari model kustom Anda dengan model Google NMT.
Pembersihan
Untuk menghindari tagihan Google Cloud yang tidak perlu, hapus model, set data, dan file en-es.tsv Anda. Anda juga dapat menggunakan
Google Cloud console untuk menghapus project Anda jika sudah tidak diperlukan.
Langkah berikutnya
- Untuk mempelajari model kustom, baca Panduan pemula.
- Untuk membuat set data dan model kustom Anda sendiri, baca Menyiapkan data pelatihan untuk mendapatkan petunjuk tentang cara menyiapkan data Anda.