이 문서에서는 생성, 가져오기, 나열, 업데이트, 삭제 작업을 비롯하여 Document AI Warehouse에서 문서 스키마를 관리하는 방법을 설명합니다.
문서 스키마란 무엇인가요?
각 문서는 특정 문서 유형에 속하며 스키마로 지정됩니다.
문서 스키마는 Document AI Warehouse에서 문서 유형 (예: 인보이스 또는 급여 명세서)의 구조를 정의하며, 관리자는 다양한 데이터 유형 (텍스트 | 숫자 | 날짜 | 열거형)의 속성을 지정할 수 있습니다.
속성은 AI 또는 실제 사용자가 문서에 추가한 추출된 데이터, 분류 태그 또는 기타 비즈니스 태그를 나타내는 데 사용됩니다(예: Invoice_Amount(숫자), Due_Date(날짜), Supplier_Name(텍스트)).
속성 속성: 각 속성은 다음과 같이 선언할 수 있습니다.
필터링 가능 - 검색 결과를 필터링하는 데 사용할 수 있습니다.
검색 가능 - 검색 쿼리에서 찾을 수 있도록 색인이 생성됨
필수 -
required은 속성이 문서에 있는지 확인하는 데 사용됩니다. 속성이 필수가 아닌 경우 대부분의 속성을required = false로 저장하는 것이 좋습니다.
확장 가능한 스키마: 수정 권한이 있는 최종 사용자가 문서에 새 스키마 속성을 추가 / 삭제해야 하는 경우가 있습니다. 이는 키-값 쌍 목록인 'MAP 속성'에 의해 지원됩니다.
MAP 속성의 각 키-값 쌍은 (Text | Numeric | Date | Enumeration) 데이터 유형일 수 있습니다.
예를 들어 인보이스에는 다음 키-값 쌍이 있는 지도 속성 'Invoice_Entities'가 포함될 수 있습니다.
Invoice_Amount (숫자) 1000
Due_Date (날짜) 2021년 12월 24일
Supplier_Name (텍스트) ABC Corp
스키마의 불변성: 스키마 또는 스키마 속성은 추가할 수 있지만 현재는 수정하거나 삭제할 수 없으므로 스키마를 신중하게 정의하세요.
시작하기 전에
시작하기 전에 빠른 시작 페이지를 완료했는지 확인하세요.
스키마 만들기
문서 스키마를 만듭니다.
REST
curl --location --request POST --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Content-Type: application/json" \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--data '{
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_searchable": true,
"is_repeatable": true,
"text_type_options": {}
}
]
}'Python
자세한 내용은 Document AI Warehouse Python API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
자세한 내용은 Document AI Warehouse Java API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Node.js
자세한 내용은 Document AI Warehouse Node.js API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
스키마 가져오기
문서 스키마의 세부정보를 가져옵니다.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
자세한 내용은 Document AI Warehouse Python API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
자세한 내용은 Document AI Warehouse Java API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Node.js
자세한 내용은 Document AI Warehouse Node.js API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
스키마 나열
문서 스키마를 나열합니다.
REST
curl --request GET --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
자세한 내용은 Document AI Warehouse Python API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
자세한 내용은 Document AI Warehouse Java API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
스키마 삭제
문서 스키마를 삭제합니다.
REST
curl --request DELETE --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8"Python
자세한 내용은 Document AI Warehouse Python API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
자세한 내용은 Document AI Warehouse Java API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Node.js
자세한 내용은 Document AI Warehouse Node.js API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
스키마 업데이트
문서 스키마를 업데이트합니다. 현재 업데이트 로직은 새 속성 정의 추가만 지원합니다. 새 문서 스키마에는 기존 스키마에 있는 모든 속성 정의가 포함되어야 합니다.
지원 유형:
- 기존 속성의 경우 사용자가
is_repeatable,is_metadata,is_required메타데이터 설정을 변경할 수 있습니다. - 기존 ENUM 속성의 경우 사용자는 새로운 ENUM 가능 값을 추가하거나 기존 ENUM 가능 값을 삭제할 수 있습니다.
EnumTypeOptions.validation_check_disabled플래그를 업데이트하여 유효성 검사를 사용 중지할 수 있습니다. 유효성 검사 확인은CreateDocumentAPI를 호출할 때 문서에 지정된 ENUM 값이 속성 정의에 정의된 가능한 ENUM 값 범위에 있는지 확인하는 데 사용됩니다. - 새 속성 정의 추가가 지원됩니다.
- 기존 속성의 경우 사용자가
지원되지 않음:
- 기존 스키마의 경우
display_name및document_is_folder업데이트가 허용되지 않습니다. - 기존 속성의 경우
name,display_name,value_type_options를 업데이트할 수 없습니다.
- 기존 스키마의 경우
REST
curl --request PATCH --url https://contentwarehouse.googleapis.com/v1/projects/PROJECT_NUMBER/locations/LOCATION/documentSchemas/{document_schema_id} \
--header "Authorization: Bearer $(gcloud auth print-access-token)" \
--header "Content-Type: application/json; charset=UTF-8" \
--data '{
"document_schema": {
"display_name": "Test Doc Schema",
"property_definitions": [
{
"name": "plaintiff",
"display_name": "Plaintiff",
"is_repeatable": true,
"text_type_options": {}
}
]
}
}'Python
자세한 내용은 Document AI Warehouse Python API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
Java
자세한 내용은 Document AI Warehouse Java API 참고 문서를 참고하세요.
Document AI Warehouse에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
다음 단계
- 문서 관리로 이동하여 문서 관리 방법을 알아보세요.