Format dan dimensi gambar yang didukung

Ada format gambar, dimensi gambar, dan ukuran file tertentu yang dapat Anda kirim ke Cloud Vision. Gunakan panduan ini untuk memastikan deteksi fitur yang efektif saat menggunakan Vision API.

Format file

Vision API mendukung jenis gambar berikut:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • GIF animasi (hanya frame pertama)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

Beberapa format gambar ini bersifat lossy (misalnya, JPEG). Mengurangi ukuran file untuk format lossy tersebut dapat menurunkan kualitas gambar dan akurasi Vision API.

Rekomendasi dimensi gambar

Untuk pendeteksian gambar yang akurat dalam Vision API, gunakan gambar yang berukuran minimal 640x480 piksel (sekitar 300.000 piksel).

Dalam praktiknya, ukuran standar 640x480 piksel dalam kebanyakan kasus berfungsi dengan baik. Ukuran gambar yang lebih besar dari 640x480 piksel mungkin tidak akan mendapatkan banyak akurasi, tetapi akan sangat mengurangi throughput. Jika memungkinkan, lakukan pemrosesan awal gambar Anda dengan mengurangi ukurannya hingga mencapai ukuran standar minimum ini.

Ukuran yang direkomendasikan berikut bervariasi menurut fitur yang terdeteksi. Misalnya, permintaan FACE_DETECTION umumnya memerlukan ukuran gambar yang lebih besar karena fitur yang terdeteksi (wajah) lebih kecil daripada gambar. LABEL_DETECTION permintaan, di sisi lain, umumnya mengevaluasi seluruh gambar.

Tabel berikut mencantumkan jenis permintaan fitur Vision API dan ukuran gambar yang direkomendasikan:

Fitur Vision API Ukuran yang direkomendasikan Catatan
FACE_DETECTION 1600x1200 Jarak antara mata adalah hal yang paling penting.
LANDMARK_DETECTION 640x480 -
LOGO_DETECTION 640x480 -
LABEL_DETECTION 640x480 -
TEXT_DETECTION dan DOCUMENT_TEXT_DETECTION 1024x768 OCR memerlukan resolusi yang lebih tinggi untuk mendeteksi karakter.
SAFE_SEARCH_DETECTION 640x480 -

Vision API memerlukan gambar yang cukup besar untuk membedakan fitur penting. Ukuran yang lebih kecil atau lebih besar dari ukuran yang direkomendasikan ini dapat digunakan. Namun, ukuran yang lebih kecil dapat menghasilkan akurasi yang lebih rendah, dan ukuran yang lebih besar dapat meningkatkan waktu pemrosesan dan penggunaan bandwidth tanpa peningkatan akurasi yang proporsional. Untuk analisis OCR, ukuran gambar tidak boleh melebihi 75.000.000 piksel (panjang x lebar). Jika gambar melebihi batas ini, Vision API akan mengubah ukurannya; jika tidak, Vision API akan menggunakan gambar asli.

Ukuran gambar dan file

File gambar yang dikirim ke Vision API tidak boleh melebihi 20 MB. File yang melebihi 20 MB akan menghasilkan error. Vision API tidak mengubah ukuran file sebesar ini.

Untuk meningkatkan latensi kueri, kurangi ukuran file Anda. Namun, hindari penurunan kualitas gambar selama proses ini.

Vision API memberlakukan batas ukuran permintaan JSON sebesar 10 MB. Hosting file yang lebih besar di Cloud Storage atau di web, bukan meneruskannya sebagai konten berenkode base64 di JSON itu sendiri.