Dokumen ini menjelaskan cara mengelola skema dokumen di Document AI Warehouse, termasuk operasi pembuatan, pengambilan, pencantuman, pembaruan, dan penghapusan.
Apa itu skema dokumen
Setiap dokumen memiliki jenis dokumen tertentu dan ditentukan oleh skema.
Skema dokumen menentukan struktur untuk jenis dokumen (misalnya, Invoice atau Slip Gaji) di Document AI Warehouse, tempat admin dapat menentukan Properti dari berbagai jenis data (Teks | Numerik | Tanggal | Enumerasi).
Properti digunakan untuk merepresentasikan data yang diekstrak, tag klasifikasi, atau tag bisnis lainnya yang ditambahkan ke dokumen oleh AI atau pengguna manusia - misalnya, Invoice_Amount (numerik), Due_Date (tanggal), atau Supplier_Name (teks).
Atribut Properti: Setiap properti dapat dideklarasikan sebagai
Dapat difilter - dapat digunakan untuk memfilter hasil penelusuran
Dapat ditelusuri - diindeks sehingga dapat ditemukan dalam kueri penelusuran
Wajib -
requireddigunakan untuk memastikan properti ada dalam dokumen (Sebaiknya simpan sebagian besar properti sebagairequired = false, kecuali properti tersebut wajib ada.)
Skema yang Dapat Diperluas: dalam beberapa kasus, pengguna akhir dengan akses Edit perlu menambahkan / menghapus properti skema baru ke dokumen. Hal ini didukung oleh "properti MAP", yang merupakan daftar pasangan nilai kunci.
Setiap key-value pair dalam properti MAP dapat berupa jenis data (Teks | Numerik | Tanggal | Enumerasi).
Misalnya, Invoice dapat berisi Properti Peta "Invoice_Entities" dengan pasangan nilai kunci berikut:
Invoice_Amount (numerik) 1000
Due_Date (date) 24/12/2021
Supplier_Name (text) ABC Corp
Tidak Dapat Diubahnya Skema: Perhatikan bahwa Skema atau Properti Skema dapat ditambahkan, tetapi saat ini tidak dapat diedit atau dihapus, jadi tentukan skema dengan cermat.
Sebelum memulai
Sebelum memulai, pastikan Anda telah menyelesaikan halaman Mulai Cepat.
Membuat skema
Buat skema dokumen.
REST
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--data '{
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_searchable": true,
"is_repeatable": true,
"text_type_options": {}
}
]
}'Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Node.js Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Mendapatkan skema
Mendapatkan detail skema dokumen.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Node.js Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Mencantumkan skema
Mencantumkan skema dokumen.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menghapus skema
Menghapus skema dokumen.
REST
curl --request DELETE --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Node.js Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Memperbarui skema
Memperbarui skema dokumen. Saat ini, logika pembaruan hanya mendukung penambahan definisi properti baru. Skema dokumen baru harus menyertakan semua definisi properti yang ada dalam skema yang ada.
Didukung:
- Untuk properti yang ada, pengguna dapat mengubah setelan metadata berikut:
is_repeatable,is_metadata,is_required. - Untuk properti ENUM yang ada, pengguna dapat menambahkan kemungkinan nilai ENUM baru atau menghapus kemungkinan nilai ENUM yang ada. Mereka dapat memperbarui flag
EnumTypeOptions.validation_check_disableduntuk menonaktifkan pemeriksaan validasi. Pemeriksaan validasi digunakan untuk memastikan nilai ENUM yang ditentukan dalam dokumen berada dalam rentang kemungkinan nilai ENUM yang ditentukan dalam definisi properti saat memanggilCreateDocumentAPI. - Menambahkan definisi properti baru didukung.
- Untuk properti yang ada, pengguna dapat mengubah setelan metadata berikut:
Tidak didukung:
- Untuk skema yang ada, update ke
display_namedandocument_is_foldertidak diizinkan. - Untuk properti yang sudah ada, pembaruan pada
name,display_name, danvalue_type_optionstidak diizinkan.
- Untuk skema yang ada, update ke
REST
curl --request PATCH --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" \
--data '{
"document_schema": {
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_repeatable": true,
"text_type_options": {}
}
]
}
}'Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Langkah berikutnya
- Lanjutkan ke Mengelola dokumen untuk mempelajari cara mengelola dokumen.