Menerjemahkan dokumen
Cloud Translation - Advanced menyediakan Document Translation API untuk menerjemahkan dokumen dalam format seperti PDF dan DOCX secara langsung. Dibandingkan dengan terjemahan teks biasa, Document Translation mempertahankan format dan tata letak asli dalam dokumen terjemahan Anda, sehingga membantu Anda mempertahankan sebanyak mungkin konteks asli seperti jeda paragraf.
Bagian berikut menjelaskan cara menerjemahkan dokumen dan menggunakan Document Translation dengan fitur Cloud Translation - Advanced lainnya seperti glosarium dan model AutoML Translation. Document Translation mendukung permintaan terjemahan online dan batch.
Untuk terjemahan teks biasa dan HTML, silakan buka Menerjemahkan teks.
Format file yang didukung
Document Translation mendukung jenis file input dan jenis file output yang terkait berikut.
| Input | Jenis MIME dokumen | Output |
|---|---|---|
| DOC* | application/msword | DOC, DOCX |
| DOCX* | application/vnd.openxmlformats-officedocument.wordprocessingml.document | DOCX |
| PDF† | application/pdf | PDF, DOCX |
| PPT | application/vnd.ms-powerpoint | PPT, PPTX |
| PPTX | application/vnd.openxmlformats-officedocument.presentationml.presentation | PPTX |
| XLS | application/vnd.ms-excel | XLS, XLSX |
| XLSX | application/vnd.openxmlformats-officedocument.spreadsheetml.sheet | XLSX |
*Konten di dalam kotak teks tidak diterjemahkan dan tetap dalam bahasa sumber.
†Document Translation mendukung dokumen PDF native dan hasil pemindaian dengan beberapa perbedaan. Agar optimal dalam penanganan format, gunakan file PDF native jika memungkinkan. Menerjemahkan file PDF yang dipindai dapat mengakibatkan hilangnya beberapa pemformatan. Tata letak PDF yang kompleks juga dapat mengakibatkan hilangnya pemformatan, yang dapat mencakup tabel data, tata letak multi-kolom, dan grafik dengan label atau keterangan.
Jika Anda memiliki konten PDF dalam format DOCX atau PPTX, sebaiknya terjemahkan konten menggunakan format tersebut sebelum mengonversinya menjadi PDF. Secara umum, Document Translation dapat mempertahankan tata letak dan gaya dokumen file DOCX dan PPTX dengan lebih baik daripada file PDF. Setelah dokumen diterjemahkan, Anda kemudian dapat mengonversi hasilnya menjadi file PDF.
Penerjemahan dokumen PDF native dan hasil pemindaian
Document Translation mendukung file PDF native dan hasil pemindaian, termasuk terjemahan ke atau dari bahasa yang ditulis dari kanan ke kiri. Dukungan untuk konversi PDF ke DOCX hanya tersedia untuk penerjemahan dokumen batch pada file PDF native. Selain itu, Document Translation mempertahankan hyperlink, ukuran font, dan warna font hanya untuk file PDF native (untuk terjemahan sinkron dan batch).
Jika Anda menerjemahkan file PDF dengan campuran konten antara PDF native dan hasil pemindaian, konten hasil pemindaian tidak akan diterjemahkan.
Sebelum memulai
Sebelum dapat mulai menggunakan Cloud Translation API, Anda harus memiliki project yang mengaktifkan Cloud Translation API, dan Anda harus memiliki kredensial yang sesuai. Anda juga dapat menginstal library klien untuk bahasa pemrograman umum guna membantu melakukan panggilan ke API. Untuk informasi selengkapnya, buka halaman Penyiapan.
Izin yang diperlukan
Untuk permintaan yang memerlukan akses Cloud Storage, seperti Document
Translation batch, Anda mungkin memerlukan izin Cloud Storage untuk
membaca file input atau mengirim file output ke bucket. Misalnya, untuk membaca file input
dari bucket, Anda harus memiliki setidaknya izin membaca objek (disediakan oleh
peran roles/storage.objectViewer) pada bucket. Untuk informasi selengkapnya tentang
peran Cloud Storage, silakan baca
dokumentasi
Cloud Storage.
Menerjemahkan dokumen (online)
Terjemahan online menyediakan pemrosesan secara real-time (pemrosesan sinkron) untuk satu file.
Untuk PDF, ukuran file dapat mencapai 20 MB dan hingga 300 halaman untuk PDF native
(memerlukan kolom isTranslateNativePdfOnly ditetapkan ke true). Jika Anda mengaktifkan
kolom enableShadowRemovalNativePdf, batasnya adalah 20 halaman. Untuk
PDF hasil pemindaian, batasnya adalah 20 halaman.
Untuk jenis dokumen lainnya, ukuran file dapat mencapai 20 MB tanpa batas halaman.
Menerjemahkan dokumen dari Cloud Storage
Contoh berikut menerjemahkan file dari bucket Cloud Storage dan menampilkan outputnya ke bucket Cloud Storage. Responsnya juga menampilkan aliran byte. Anda dapat menentukan jenis MIME; tapi jika tidak, Document Translation akan menentukannya berdasarkan ekstensi file input.
Jika Anda tidak menentukan kode bahasa sumber, Document Translation akan mendeteksi bahasanya untuk Anda. Bahasa yang terdeteksi akan disertakan dalam output di
kolom detectedLanguageCode.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_NUMBER_OR_ID: ID numerik atau alfanumerik project Google Cloud Anda.
- LOCATION: Region tempat Anda ingin menjalankan operasi ini. Contoh,
us-central1. - SOURCE_LANGUAGE: (Opsional) Kode bahasa dokumen input. Jika bahasanya diketahui, setel ke salah satu kode bahasa yang tercantum di Dukungan bahasa.
- TARGET_LANGUAGE: Target bahasa untuk menerjemahkan dokumen input. Setel ke salah satu kode bahasa yang tercantum dalam Dukungan bahasa.
- INPUT_FILE_PATH: Lokasi Cloud Storage dan nama file dokumen input.
- OUTPUT_FILE_PREFIX: Lokasi Cloud Storage tempat dokumen output akan disimpan.
- IS_NATIVE: (Opsional) Untuk dokumen PDF native, nilai boolean yang menunjukkan apakah permintaan Anda menggunakan batas halaman PDF native atau hasil pemindaian. Jika benar, batas halaman akan ditambah menjadi 300 halaman untuk dokumen PDF native saja. Jika salah (false) atau tidak ditentukan, maka akan digunakan batas halaman untuk PDF hasil pemindaian (20 halaman).
Metode HTTP dan URL:
POST https://translation.googleapis.com/v3/projects/PROJECT_NUMBER_OR_ID/locations/LOCATION:translateDocument
Meminta isi JSON:
{
"source_language_code": "SOURCE_LANGUAGE",
"target_language_code": "TARGET_LANGUAGE",
"document_input_config": {
"gcsSource": {
"inputUri": "gs://INPUT_FILE_PATH"
}
},
"document_output_config": {
"gcsDestination": {
"outputUriPrefix": "gs://OUTPUT_FILE_PREFIX"
}
},
"isTranslateNativePdfOnly": IS_NATIVE
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
{
"documentTranslation": {
"byteStreamOutputs": ["BYTE_STREAM"],
"mimeType": "MIME_TYPE"
},
"model": "projects/PROJECT_NUMBER/locations/LOCATION/models/general/nmt"
}
Node.js
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Node.js di panduan memulai Cloud Translation menggunakan library klien. Untuk mengetahui informasi selengkapnya, baca dokumentasi referensi API Node.js Cloud Translation.
Untuk melakukan autentikasi ke Cloud Translation, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca bagian Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menerjemahkan dokumen secara langsung
Contoh berikut mengirim dokumen secara langsung sebagai bagian dari permintaan. Anda harus menyertakan jenis MIME untuk penerjemahan dokumen secara langsung.
Jika Anda tidak menentukan kode bahasa sumber, Document Translation akan mendeteksi bahasanya untuk Anda. Bahasa yang terdeteksi akan disertakan dalam output di
kolom detectedLanguageCode.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_NUMBER_OR_ID: ID numerik atau alfanumerik project Google Cloud Anda.
- LOCATION: Region tempat Anda ingin menjalankan operasi ini. Contoh,
us-central1. - SOURCE_LANGUAGE: (Opsional) Kode bahasa dokumen input. Jika bahasanya diketahui, setel ke salah satu kode bahasa yang tercantum di Dukungan bahasa.
- TARGET_LANGUAGE: Target bahasa untuk menerjemahkan dokumen input. Setel ke salah satu kode bahasa yang tercantum dalam Dukungan bahasa.
- MIME_TYPE: Format dokumen sumber, seperti
application/pdf. - INPUT_BYTE_STREAM: Konten dokumen input yang direpresentasikan sebagai aliran byte.
- OUTPUT_FILE_PREFIX: Lokasi Cloud Storage tempat dokumen output akan disimpan.
- IS_NATIVE: (Opsional) Untuk dokumen PDF native, nilai boolean yang menunjukkan apakah permintaan Anda menggunakan batas halaman PDF native atau hasil pemindaian. Jika benar, batas halaman akan ditambah menjadi 300 halaman untuk dokumen PDF native saja. Jika salah (false) atau tidak ditentukan, maka akan digunakan batas halaman untuk PDF hasil pemindaian (20 halaman).
Metode HTTP dan URL:
POST https://translation.googleapis.com/v3/projects/PROJECT_NUMBER_OR_ID/locations/LOCATION:translateDocument
Meminta isi JSON:
{
"source_language_code": "SOURCE_LANGUAGE",
"target_language_code": "TARGET_LANGUAGE",
"document_input_config": {
"mimeType": "MIME_TYPE",
"content": "INPUT_BYTE_STREAM"
},
"document_output_config": {
"gcsDestination": {
"outputUriPrefix": "gs://OUTPUT_FILE_PREFIX"
}
},
"isTranslateNativePdfOnly": IS_NATIVE
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
{
"documentTranslation": {
"byteStreamOutputs": ["BYTE_STREAM"],
"mimeType": "MIME_TYPE"
},
"model": "projects/PROJECT_NUMBER/locations/LOCATION/models/general/nmt"
}
Python
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Python di panduan memulai Cloud Translation menggunakan library klien. Untuk mengetahui informasi selengkapnya, baca dokumentasi referensi API Python Cloud Translation.
Untuk melakukan autentikasi ke Cloud Translation, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca bagian Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menggunakan model AutoML atau glosarium
Anda dapat menggunakan model Terjemahan AutoML Anda sendiri untuk menerjemahkan dokumen, bukan model yang dikelola Google. Selain menentukan model, Anda juga dapat menyertakan glosarium untuk menangani terminologi dalam domain yang spesifik. Jika Anda menentukan model atau glosarium, Anda harus menentukan bahasa sumber. Contoh berikut menggunakan model AutoML dan glosarium. Jika model atau glosarium tersebut berada dalam project yang berbeda, Anda harus memiliki izin IAM yang sesuai untuk mengakses resource tersebut.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_NUMBER_OR_ID: ID numerik atau alfanumerik project Google Cloud Anda.
- LOCATION: Region tempat Anda ingin menjalankan operasi ini, seperti
us-central1. Lokasi harus sesuai dengan region tempat model, glosarium, atau keduanya berada. - SOURCE_LANGUAGE: Kode bahasa dokumen input. Setel ke salah satu kode bahasa yang tercantum dalam Dukungan bahasa.
- TARGET_LANGUAGE: Target bahasa untuk menerjemahkan dokumen input. Setel ke salah satu kode bahasa yang tercantum dalam Dukungan bahasa.
- INPUT_FILE_PATH: Lokasi Cloud Storage dan nama file dokumen input.
- OUTPUT_FILE_PREFIX: Lokasi Cloud Storage tempat dokumen output akan disimpan.
- MODEL_PROJECT_ID: Project ID tempat model berada.
- MODEL_LOCATION: Region tempat model berada.
- MODEL_ID: ID model yang akan digunakan.
- GLOSSARY_PROJECT_ID: Project ID tempat glosarium berada.
- GLOSSARY_LOCATION: Region tempat glosarium berada.
- GLOSSARY_ID: ID glosarium yang akan digunakan.
Metode HTTP dan URL:
POST https://translation.googleapis.com/v3/projects/PROJECT_NUMBER_OR_ID/locations/LOCATION:translateDocument
Meminta isi JSON:
{
"source_language_code": "SOURCE_LANGUAGE",
"target_language_code": "TARGET_LANGUAGE",
"document_input_config": {
"gcsSource": {
"inputUri": "gs://INPUT_FILE_PATH"
}
},
"document_output_config": {
"gcsDestination": {
"outputUriPrefix": "gs://OUTPUT_FILE_PREFIX"
}
},
"model": "projects/MODEL_PROJECT_ID/locations/MODEL_LOCATION/models/MODEL_ID",
"glossary_config": {
"glossary": "projects/GLOSSARY_PROJECT_ID/locations/MODEL_LOCATION/glossaries/GLOSSARY_ID"
}
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Anda akan menerima respons JSON yang mirip dengan yang berikut ini:
{
"documentTranslation": {
"byteStreamOutputs": ["BYTE_STREAM"],
"mimeType": "MIME_TYPE"
},
"glossary_document_translation": {
"byteStreamOutputs": ["BYTE_STREAM_USING_GLOSSARY"],
"mimeType": "MIME_TYPE"
},
"model": "projects/MODEL_PROJECT_ID/locations/MODEL_LOCATION/models/MODEL_ID",
"glossaryConfig": {
"glossary": "projects/GLOSSARY_PROJECT_ID/locations/MODEL_LOCATION/glossaries/GLOSSARY_ID"
}
}
Menerjemahkan dokumen (batch)
Dengan terjemahan batch, Anda dapat menerjemahkan beberapa file ke dalam beberapa bahasa dalam satu permintaan. Untuk setiap permintaan, Anda dapat mengirim hingga 100 file dengan total ukuran konten hingga 1 GB atau 100 juta poin kode Unicode, batas mana pun yang tercapai terlebih dahulu. Anda dapat menentukan model terjemahan tertentu untuk setiap bahasa.
Menerjemahkan beberapa dokumen
Contoh berikut mencakup beberapa konfigurasi input. Setiap konfigurasi input adalah pointer ke file yang ada di bucket Cloud Storage.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_NUMBER_OR_ID: ID numerik atau alfanumerik project Google Cloud Anda
- LOCATION: Region tempat Anda ingin menjalankan operasi ini. Contoh,
us-central1. - SOURCE_LANGUAGE: Kode bahasa dokumen input. Setel ke salah satu kode bahasa yang tercantum dalam Dukungan bahasa.
- TARGET_LANGUAGE: Target bahasa untuk menerjemahkan dokumen input. Gunakan kode bahasa yang tercantum di Dukungan bahasa.
- INPUT_FILE_PATH: Lokasi Cloud Storage dan nama file dari satu atau beberapa dokumen input.
- OUTPUT_FILE_PREFIX: Lokasi Cloud Storage tempat semua dokumen output akan disimpan.
Metode HTTP dan URL:
POST https://translation.googleapis.com/v3/projects/PROJECT_NUMBER_OR_ID/locations/LOCATION:batchTranslateDocument
Meminta isi JSON:
{
"source_language_code": "SOURCE_LANGUAGE",
"target_language_codes": ["TARGET_LANGUAGE", ...],
"input_configs": [
{
"gcsSource": {
"inputUri": "gs://INPUT_FILE_PATH_1"
}
},
{
"gcsSource": {
"inputUri": "gs://INPUT_FILE_PATH_2"
}
},
...
],
"output_config": {
"gcsDestination": {
"outputUriPrefix": "gs://OUTPUT_FILE_PREFIX"
}
}
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Respons ini akan berisi ID untuk operasi yang berjalan lama.
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.translation.v3.BatchTranslateDocumentMetadata",
"state": "RUNNING"
}
}
Node.js
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Node.js di panduan memulai Cloud Translation menggunakan library klien. Untuk mengetahui informasi selengkapnya, baca dokumentasi referensi API Node.js Cloud Translation.
Untuk melakukan autentikasi ke Cloud Translation, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca bagian Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Sebelum mencoba contoh ini, ikuti petunjuk penyiapan Python di panduan memulai Cloud Translation menggunakan library klien. Untuk mengetahui informasi selengkapnya, baca dokumentasi referensi API Python Cloud Translation.
Untuk melakukan autentikasi ke Cloud Translation, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca bagian Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menerjemahkan dan mengonversi file PDF native
Contoh berikut menerjemahkan dan mengonversi file PDF native menjadi file DOCX. Anda dapat menentukan beberapa input untuk berbagai jenis file; tidak semua harus berupa file PDF native. Namun, file PDF yang dipindai tidak dapat disertakan saat menyertakan konversi; permintaan akan ditolak dan tidak akan ada terjemahan yang diselesaikan. Hanya file PDF native yang akan diterjemahkan dan dikonversi menjadi file DOCX. Misalnya, jika Anda menyertakan file PPTX, file tersebut akan diterjemahkan dan ditampilkan sebagai file PPTX.
Jika Anda menerjemahkan campuran file PDF native dan hasil pemindaian secara rutin, sebaiknya Anda menyusun semuanya ke dalam bucket Cloud Storage yang terpisah. Dengan begitu, saat meminta terjemahan dan konversi batch, Anda dapat dengan mudah mengecualikan bucket yang berisi file PDF hasil pemindaian, tanpa harus mengecualikan file-file tersebut satu per satu.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_NUMBER_OR_ID: ID numerik atau alfanumerik project Google Cloud Anda
- LOCATION: Region tempat Anda ingin menjalankan operasi ini. Contoh,
us-central1. - SOURCE_LANGUAGE: Kode bahasa dokumen input. Setel ke salah satu kode bahasa yang tercantum dalam Dukungan bahasa.
- TARGET_LANGUAGE: Target bahasa untuk menerjemahkan dokumen input. Gunakan kode bahasa yang tercantum di Dukungan bahasa.
- INPUT_FILE_PATH: Lokasi Cloud Storage dan nama file dari satu atau beberapa file PDF native.
- OUTPUT_FILE_PREFIX: Lokasi Cloud Storage tempat semua dokumen output akan disimpan.
Metode HTTP dan URL:
POST https://translation.googleapis.com/v3/projects/PROJECT_NUMBER_OR_ID/locations/LOCATION:batchTranslateDocument
Meminta isi JSON:
{
"source_language_code": "SOURCE_LANGUAGE",
"target_language_codes": ["TARGET_LANGUAGE", ...],
"input_configs": [
{
"gcsSource": {
"inputUri": "gs://INPUT_FILE_PATH_1"
}
},
{
"gcsSource": {
"inputUri": "gs://INPUT_FILE_PATH_2"
}
},
...
],
"output_config": {
"gcsDestination": {
"outputUriPrefix": "gs://OUTPUT_FILE_PREFIX"
}
},
"format_conversions": {
"application/pdf": "application/vnd.openxmlformats-officedocument.wordprocessingml.document"
}
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Respons ini akan berisi ID untuk operasi yang berjalan lama.
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.translation.v3.BatchTranslateDocumentMetadata",
"state": "RUNNING"
}
}
Menggunakan model AutoML atau glosarium
Anda dapat menggunakan model Terjemahan AutoML Anda sendiri untuk menerjemahkan dokumen, bukan model yang dikelola Google. Selain menentukan model, Anda juga dapat menyertakan glosarium untuk menangani terminologi dalam domain yang spesifik. Jika Anda menentukan model atau glosarium, Anda harus menentukan bahasa sumber. Contoh berikut menggunakan model AutoML dan glosarium. Anda dapat menentukan hingga 10 target bahasa yang memiliki model dan glosariumnya sendiri.
Jika Anda menentukan model untuk beberapa target bahasa dan tidak menentukannya untuk bahasa lain, Document Translation akan menggunakan model yang dikelola Google untuk bahasa yang tidak ditentukan. Demikian pula, jika Anda menentukan glosarium untuk beberapa target bahasa, Document Translation tidak akan menggunakan glosarium untuk bahasa yang tidak ditentukan.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_NUMBER_OR_ID: ID numerik atau alfanumerik project Google Cloud Anda
- LOCATION: Region tempat Anda ingin menjalankan operasi ini, seperti
us-central1. Lokasi harus sesuai dengan region tempat model, glosarium, atau keduanya berada. - SOURCE_LANGUAGE: Kode bahasa dokumen input. Setel ke salah satu kode bahasa yang tercantum dalam Dukungan bahasa.
- TARGET_LANGUAGE: Target bahasa untuk menerjemahkan dokumen input. Gunakan kode bahasa yang tercantum di Dukungan bahasa.
- INPUT_FILE_PATH: Lokasi Cloud Storage dan nama file dari satu atau beberapa dokumen input.
- OUTPUT_FILE_PREFIX: Lokasi Cloud Storage tempat semua dokumen output akan disimpan.
- MODEL_PROJECT_ID: Project ID tempat model berada.
- MODEL_LOCATION: Region tempat model berada.
- MODEL_ID: ID model yang akan digunakan.
- GLOSSARY_PROJECT_ID: Project ID tempat glosarium berada.
- GLOSSARY_LOCATION: Region tempat glosarium berada.
- GLOSSARY_ID: ID glosarium yang akan digunakan.
Metode HTTP dan URL:
POST https://translation.googleapis.com/v3/projects/PROJECT_NUMBER_OR_ID/locations/LOCATION:translateDocument
Meminta isi JSON:
{
"source_language_code": "SOURCE_LANGUAGE",
"target_language_codes": "[TARGET_LANGUAGE, ...]",
"input_configs": [
{
"gcsSource": {
"inputUri": "gs://INPUT_FILE_PATH"
}
}
],
"output_config": {
"gcsDestination": {
"outputUriPrefix": "gs://OUTPUT_FILE_PREFIX"
}
},
"models": {
"TARGET_LANGUAGE": "projects/MODEL_PROJECT_ID/locations/MODEL_LOCATION/models/MODEL_ID",
...
},
"glossaries": {
"TARGET_LANGUAGE": {
"glossary": "projects/GLOSSARY_PROJECT_ID/locations/MODEL_LOCATION/glossaries/GLOSSARY_ID"
},
...
}
}
Untuk mengirim permintaan Anda, perluas salah satu opsi berikut:
Respons ini akan berisi ID untuk operasi yang berjalan lama.
{
"name": "projects/PROJECT_NUMBER/locations/LOCATION/operations/OPERATION_ID",
"metadata": {
"@type": "type.googleapis.com/google.cloud.translation.v3.BatchTranslateDocumentMetadata",
"state": "RUNNING"
}
}
Teks yang tumpang-tindih
Dalam beberapa kasus, terjemahan PDF native mungkin menyertakan teks terjemahan yang menimpa teks sumber. Masalah ini disebut teks bayangan.
Dalam kasus tertentu, Anda dapat menghapus teks bayangan dengan mengaktifkan opsi
enableShadowRemovalNativePdf. Jika Anda mengaktifkan opsi ini, latensi respons akan meningkat dan, untuk
terjemahan dokumen online, batas halaman dikurangi menjadi 20. Anda dapat mengetahui
apakah dokumen memerlukan penghapusan teks bayangan hanya setelah dokumen tersebut selesai diterjemahkan.
Dalam kasus lain, jika opsi enableShadowRemovalNativePdf tidak
berfungsi, konversi PDF menjadi gambar dahulu, lalu terjemahkan. Biasanya, kasus ini
mencakup teks yang memiliki beberapa lapisan, seperti saat teks yang dapat dipilih berada di atas
gambar latar belakang yang juga menyertakan teks. Mengonversi PDF menjadi gambar memungkinkan Cloud Translation memproses dokumen tersebut sebagai PDF yang dipindai. Untuk melakukan konversi,
Anda dapat menggunakan Chrome (cetak sebagai gambar) atau alat pihak ketiga lainnya.
Orientasi teks
Untuk terjemahan PDF hasil pemindaian, orientasi teks sumber harus horizontal. Misalnya, jika dokumen yang dipindai menyertakan teks yang miring ke atas atau ke bawah, Cloud Translation mungkin tidak akan bisa menguraikan semua teks dengan benar, sehingga menghasilkan terjemahan yang salah atau tidak lengkap.
Jika dokumen tidak memiliki orientasi yang konsisten, Anda dapat meminta Cloud Translation
untuk mengorientasikannya. Dalam permintaan terjemahan Anda, aktifkan opsi
enableRotationCorrection
agar teks diorientasikan dengan benar sebelum diterjemahkan.
Langkah berikutnya
- Document Translation dikenakan biaya per halaman. Untuk informasi selengkapnya, buka Harga.