Dokumen ini menjelaskan cara mengelola dokumen di Document AI Warehouse, termasuk operasi pembuatan, pengambilan, pembaruan, dan penghapusan.
Apa itu dokumen
Dokumen adalah model data yang digunakan di Document AI Warehouse untuk mengatur dokumen dunia nyata (misalnya, PDF atau TXT) dan properti terkaitnya. Anda berinteraksi dengan Document AI Warehouse melalui operasi pada dokumen.
Jenis file yang didukung
Meskipun fokus Document AI Warehouse adalah dokumen, layanan ini juga digunakan untuk mengelola gambar terkait (misalnya, di bidang seperti asuransi, teknik, konstruksi, dan riset).
- Ingest API mendukung PDF dan gambar TIFF, JPEG, dan PNG, beserta properti atau teks yang telah diekstrak sebelumnya.
- UI Upload mendukung ekstraksi PDF menggunakan OCR Document AI dan pemroses kustom.
- UI Penampil mendukung rendering dalam file PDF, teks, dan Microsoft Office.
Sebelum memulai
Sebelum memulai, pastikan Anda telah menyelesaikan halaman Mulai Cepat.
Untuk pembuatan dokumen, jika data Anda berada di bucket Cloud Storage Anda sendiri, Anda harus memberi akun layanan Document AI Warehouse izin penampil objek penyimpanan untuk membaca data Anda.
Setiap dokumen ditentukan oleh skema dan termasuk dalam jenis dokumen. Skema dokumen menentukan struktur dokumen di Document AI Warehouse. Sebelum dapat membuat dokumen, Anda harus membuat skema dokumen.
Membuat dokumen
Untuk membuat dokumen, Anda harus memberikan konten dokumen mentah ke Document AI Warehouse. Dua cara untuk memberikan konten byte dokumen mentah adalah dengan
menetapkan Document.inline_raw_document atau Document.raw_document_path.
Perbedaannya adalah sebagai berikut:
Document.raw_document_path: Ini adalah pendekatan yang disarankan. Menggunakan jalur Cloud Storage (gs://bucket/object) file yang akan di-ingest. Perhatikan bahwa pemanggil harus memiliki izin baca pada objek ini agar panggilan berhasil.Document.inline_raw_document: representasi byte/teks file, diberikan langsung ke endpoint.
Untuk membuat dokumen, lakukan hal berikut:
Mengupload dokumen dari Cloud Storage
Anda harus memberikan akses akun layanan Document AI Warehouse ke bucket Cloud Storage Anda seperti yang dijelaskan di bagian prasyarat.
Anda perlu mengupload file ke bucket Cloud Storage, dengan mengikuti petunjuk.
REST
Permintaan:
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documents \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=utf-8" \
--data '{
"document": {
"display_name": "TestDoc3",
"document_schema_name": "projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/DOCUMENT_SCHEMA_ID",
"raw_document_path": "gs://BUCKET_URI/FILE_URI",
"properties": [
{
"name": "supplier_name",
"text_values": {
"values": "Stanford Plumbing & Heating"
}
},
{
"name": "total_amount",
"float_values": {
"values": "1091.81"
}
},
]
},
"requestMetadata":{
"userInfo":{
"id": "user:USER_EMAIL_ID"
}
}
}'Mengupload dari komputer lokal
REST
Permintaan:
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documents/ \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=utf-8" \
--data '{
"document": {
"display_name": "TestDoc3",
"document_schema_name": "projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/DOCUMENT_SCHEMA_ID",
"inline_raw_document": "<bytes>",
"properties": [
{
"name": "supplier_name",
"text_values": {
"values": "Stanford Plumbing & Heating"
}
},
{
"name": "total_amount",
"float_values": {
"values": "1091.81"
}
},
]
},
"requestMetadata": {
"userInfo": {
"id": "user:USER_EMAIL_ID"
}
}
}'Mendapatkan dokumen
Oleh document_id:
REST
curl --request POST \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" -d '{
"requestMetadata":{
"userInfo":{
"id": "user:USER_EMAIL"
}
}
}' \
"https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documents/DOCUMENT_ID:get"Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Node.js Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Oleh reference_id:
curl --request POST \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" -d '{
"requestMetadata":{
"userInfo":{
"id": "user:USER_EMAIL"
}
}
}' \
"https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documents/referenceId/REFERENCE_ID:get"Memperbarui dokumen
Oleh document_id:
REST
posix-terminal
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documents \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=utf-8" \
--data '{
"document": {
"display_name": "TestDoc3",
"document_schema_name": "projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/DOCUMENT_SCHEMA_ID",
"raw_document_path": "gs://BUCKET_URI/FILE_URI",
"properties": [
{
"name": "supplier_name",
"text_values": {
"values": "Stanford Plumbing & Heating"
}
},
{
"name": "total_amount",
"float_values": {
"values": "1091.81"
}
},
{
"name": "invoice_id",
"text_values": {
"values": "invoiceid"
}
},
]
},
"requestMetadata": {
"userInfo": {
"id": "user:USER_EMAIL"
}
}
}'
Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI Warehouse.
Untuk melakukan autentikasi ke Document AI Warehouse, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Oleh reference_id:
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documents \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=utf-8" \
--data '{
"document": {
"display_name": "TestDoc3",
"document_schema_name": "projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/referenceId/REFERENCE_ID",
"raw_document_path": "gs://BUCKET_URI/FILE_URI",
"properties": [
{
"name": "supplier_name",
"text_values": {
"values": "Stanford Plumbing & Heating"
}
},
{
"name": "total_amount",
"float_values": {
"values": "1091.81"
}
},
{
"name": "invoice_id",
"text_values": {
"values": "invoiceid"
}
},
]
},
"requestMetadata": {
"userInfo": {
"id": "user:USER_EMAIL"
}
}
}'Menghapus dokumen
REST
Oleh document_id:
curl --request POST \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" -d '{
"requestMetadata":{
"userInfo":{
"id": "user:USER_EMAIL"
}
}
}' \
"https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documents/DOCUMENT_ID:delete"Oleh reference_id:
curl --request POST \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" -d '{
"requestMetadata":{
"userInfo":{
"id": "user:USER_EMAIL"
}
}
}' \
"https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documents/referenceId/REFERENCE_ID":delete"Langkah berikutnya
- Lanjutkan ke Mengatur dokumen dalam folder untuk mempelajari cara mengatur dokumen dalam folder.