Ada format gambar, dimensi gambar, dan ukuran file tertentu yang dapat Anda kirim ke Cloud Vision. Gunakan panduan ini untuk memastikan deteksi fitur yang efektif saat menggunakan Vision API.
Format file
Vision API mendukung jenis gambar berikut:
- JPEG
- PNG8
- PNG24
- GIF
- GIF animasi (hanya frame pertama)
- BMP
- WEBP
- RAW
- ICO
- TIFF
Beberapa format gambar ini bersifat lossy (misalnya, JPEG). Mengurangi ukuran file untuk format lossy tersebut dapat menurunkan kualitas gambar dan akurasi Vision API.
Rekomendasi dimensi gambar
Untuk pendeteksian gambar yang akurat dalam Vision API, gunakan gambar yang berukuran minimal 640x480 piksel (sekitar 300.000 piksel).
Dalam praktiknya, ukuran standar 640x480 piksel dalam kebanyakan kasus berfungsi dengan baik. Ukuran gambar yang lebih besar dari 640x480 piksel mungkin tidak akan mendapatkan banyak akurasi, tetapi akan sangat mengurangi throughput. Jika memungkinkan, lakukan pemrosesan awal gambar Anda dengan mengurangi ukurannya hingga mencapai ukuran standar minimum ini.
Ukuran yang direkomendasikan berikut bervariasi menurut fitur yang terdeteksi. Misalnya,
permintaan FACE_DETECTION umumnya memerlukan ukuran gambar yang lebih besar karena
fitur yang terdeteksi (wajah) lebih kecil daripada gambar. LABEL_DETECTION
permintaan, di sisi lain, umumnya mengevaluasi seluruh gambar.
Tabel berikut mencantumkan jenis permintaan fitur Vision API dan ukuran gambar yang direkomendasikan:
| Fitur Vision API | Ukuran yang direkomendasikan | Catatan |
|---|---|---|
FACE_DETECTION |
1600x1200 | Jarak antara mata adalah hal yang paling penting. |
LANDMARK_DETECTION |
640x480 | - |
LOGO_DETECTION |
640x480 | - |
LABEL_DETECTION |
640x480 | - |
TEXT_DETECTION dan DOCUMENT_TEXT_DETECTION |
1024x768 | OCR memerlukan resolusi yang lebih tinggi untuk mendeteksi karakter. |
SAFE_SEARCH_DETECTION |
640x480 | - |
Vision API memerlukan gambar yang cukup besar untuk membedakan fitur penting. Ukuran yang lebih kecil atau lebih besar dari ukuran yang direkomendasikan ini dapat digunakan. Namun, ukuran yang lebih kecil dapat menghasilkan akurasi yang lebih rendah, dan ukuran yang lebih besar dapat meningkatkan waktu pemrosesan dan penggunaan bandwidth tanpa peningkatan akurasi yang proporsional. Untuk analisis OCR, ukuran gambar tidak boleh melebihi 75.000.000 piksel (panjang x lebar). Jika gambar melebihi batas ini, Vision API akan mengubah ukurannya; jika tidak, Vision API akan menggunakan gambar asli.
Ukuran gambar dan file
File gambar yang dikirim ke Vision API tidak boleh melebihi 20 MB. File yang melebihi 20 MB akan menghasilkan error. Vision API tidak mengubah ukuran file sebesar ini.
Untuk meningkatkan latensi kueri, kurangi ukuran file Anda. Namun, hindari penurunan kualitas gambar selama proses ini.
Vision API memberlakukan batas ukuran permintaan JSON sebesar 10 MB. Hosting file yang lebih besar di Cloud Storage atau di web, bukan meneruskannya sebagai konten berenkode base64 di JSON itu sendiri.