Dokumen ini adalah panduan konsep dasar penggunaan Document AI. Anda harus membaca halaman ini sebelum melanjutkan ke dokumentasi atau panduan memulai lainnya.
Mengotomatiskan alur kerja pemrosesan dokumen
Bisnis di seluruh dunia sangat bergantung pada dokumen untuk menyimpan dan menyampaikan informasi. Informasi ini sering kali perlu didigitalkan agar dapat berguna. Namun, hal ini biasanya dilakukan melalui proses manual yang memakan waktu.
Contoh:
- Mendigitalkan buku untuk e-reader.
- Memproses formulir pendaftaran medis di kantor dokter.
- Mengurai tanda terima dan invoice untuk validasi laporan pengeluaran.
- Mengautentikasi identitas berdasarkan kartu identitas.
- Mengekstrak informasi pendapatan dari formulir pajak untuk menyetujui pinjaman.
- Memahami kontrak untuk mengetahui persyaratan perjanjian bisnis utama.
Setiap alur kerja ini melibatkan pengambilan teks mentah dari dokumen, lalu mengekstrak teks tertentu dari teks yang sesuai dengan data yang diperlukan (kolom atau entity). Namun, setiap jenis dokumen memiliki struktur dan tata letak yang berbeda, dan pola kolom bervariasi bergantung pada kasus penggunaan tertentu.
Komponen Document AI
Document AI adalah platform pemrosesan dan pemahaman dokumen yang mengambil data tidak terstruktur dari dokumen dan mengubahnya menjadi data terstruktur (kolom tertentu, cocok untuk database), sehingga lebih mudah dipahami, dianalisis, dan digunakan.
Document AI dibangun di atas produk dalam Vertex AI dengan AI generatif untuk membantu Anda membuat aplikasi pemrosesan dokumen berbasis cloud yang skalabel dan menyeluruh tanpa memerlukan keahlian machine learning khusus.
Dengan Document AI, Anda dapat:
- Mendigitalkan dokumen menggunakan OCR untuk mendapatkan teks, tata letak, dan berbagai add-on seperti deteksi kualitas gambar (untuk keterbacaan) dan deskewing (sepenuhnya otomatis).
- Mengekstrak informasi teks dan tata letak dari file dokumen dan menormalkan entity.
- Mengidentifikasi pasangan nilai kunci (kvp) dalam formulir terstruktur dan tabel reguler. Contoh:
Name: Jill Smithadalah kvp. - Mengklasifikasikan jenis dokumen untuk mendorong proses downstream seperti ekstraksi dan penyimpanan.
- Memisahkan dan mengklasifikasikan dokumen berdasarkan jenis. Misalnya, file PDF dengan beberapa dokumen asli.
- Menyiapkan set data untuk digunakan dalam penyetelan dan evaluasi model menggunakan fitur pemberian label otomatis, pengelolaan skema, dan pengelolaan set data seperti peninjauan dokumen dan prediksi.
- Mengintegrasikannya dengan produk seperti Cloud Storage, BigQuery, dan Agent Search untuk membantu Anda menyimpan, menelusuri, mengelola, mengatur, dan menganalisis dokumen serta metadata.
Diagram ini mengilustrasikan semua langkah pemrosesan dokumen utama yang didukung oleh Document AI dan cara langkah-langkah tersebut dapat terhubung satu sama lain.

Prosesor
Prosesor Document AI terletak di antara file dokumen dan model machine learning yang melakukan tindakan pemrosesan dan pemahaman dokumen. Prosesor dapat digunakan untuk mengklasifikasikan, memisahkan, mengurai, atau menganalisis dokumen.
Setiap Google Cloud proyek harus membuat instance prosesornya sendiri.
Prosesor termasuk dalam salah satu kategori berikut:
- Mendigitalkan: OCR.
- Mengekstrak: Pengekstrak kustom, Parser Formulir, parser tata letak, dan parser terlatih.
- Mengklasifikasikan: Pengklasifikasi kustom dan pemisah kustom.
Lihat Daftar lengkap prosesor dan detail untuk mengetahui informasi tentang semua jenis prosesor yang tersedia untuk Document AI.
Prosesor mana yang harus saya gunakan?
Untuk memutuskan jenis prosesor yang akan digunakan untuk aplikasi tertentu, berikut beberapa panduan umum:
| Kategori | Kasus penggunaan | Jenis prosesor |
|---|---|---|
| Mendigitalkan | Mengekstrak informasi teks dan tata letak dari dokumen. | Enterprise Document OCR |
| Menganalisis kualitas gambar hasil pemindaian (keterbacaan) dokumen. | Enterprise Document OCR dengan analisis kualitas gambar diaktifkan | |
| Mengekstrak entity dari dokumen kustom yang tidak memenuhi kriteria prosesor kustom. | ||
| Mengekstrak | Mengekstrak tabel atau kvp dari formulir terstruktur dalam dokumen. | Parser Formulir |
| Mengekstrak elemen seperti teks, tabel, dan daftar dalam dokumen serta menampilkan potongan kontekstual. | Parser Tata Letak | |
| Mengekstrak entity dari dokumen kustom yang memenuhi kriteria prosesor kustom. | Membuat pengekstrak kustom | |
| Mengekstrak entity dari jenis dokumen khusus. | Prosesor terlatih (Latih ulang untuk meningkatkan kualitas.) | |
| Mengklasifikasikan | Mengklasifikasikan dokumen. | Membuat Pengklasifikasi Kustom |
| Memisahkan dokumen. | Membuat Pemisah Kustom |
Diagram ini membantu menentukan prosesor mana yang paling cocok untuk setiap kasus penggunaan.

Menggunakan prosesor Document AI
Berikut adalah langkah-langkah utama untuk menggunakan Document AI guna mulai memproses dokumen:
Pilih prosesor yang sesuai dengan kasus penggunaan Anda.
- Untuk mengetahui informasi lengkap tentang setiap prosesor, lihat Daftar lengkap prosesor dan detail.
Buat prosesor menggunakan Google Cloud konsol atau Document AI API.
Document AI membuat endpoint prediksi tempat Anda dapat mengirimkan dokumen.
Untuk mengetahui petunjuk mendetail, lihat Membuat prosesor.
Latih prosesor dengan data pelatihan dan pengujian dari awal, atau latih ulang versi prosesor baru (terlatih) di atas versi yang sudah ada.
- Untuk mengetahui petunjuk mendetail, lihat Melatih prosesor.
Kirim dokumen Anda untuk diproses.
Document AI memproses dokumen dan menampilkan satu atau beberapa
Documentobjek, yang berisi informasi terstruktur yang diekstrak.Untuk mengetahui petunjuk mendetail, lihat Mengirim permintaan pemrosesan dan Menangani respons pemrosesan.