검증 및 수정

Document AI를 사용하여 문서 처리 결과를 검사하는 커스텀 비즈니스 규칙을 정의할 수 있습니다. 검사 는 최종 추출된 항목에 검사 규칙을 실행하는 문서 처리 프로세스입니다. 수정 은 검사 규칙 결과를 기반으로 추출 결과를 개선하여 추출 정확도를 높이는 선택적 프로세스입니다.

검사 규칙 은 예를 들어 품목 가격의 합계가 총 가치와 같은지 확인하거나, 여러 문서에서 필드 일관성을 확인하거나, 추출된 필드가 레이아웃에서 공간적으로 정렬되어 있는지 (예: 가로 블록 내) 확인할 수 있습니다. Common Expression Language (CEL)를 사용하여 비즈니스 규칙을 정의하고 자연어 프롬프트에서 생성합니다.

검사 및 수정 사용 설정

Document AI 콘솔에서 검사 및 수정을 독립적으로 사용 설정할 수 있습니다. 이러한 설정은 선택한 프로세서 버전의 모든 processDocument 요청에 적용됩니다. 하지만 processDocument API 호출의 매개변수를 사용하여 개별 요청에 대해 이 동작을 재정의할 수 있습니다.

검사 규칙을 포함한 검사 및 수정 구성은 각 프로세서 버전에 따라 다릅니다. 모든 Google 관리형 사전 학습된 프로세서 버전은 공통 기본 구성을 공유합니다. 세부 조정을 통해 새 커스텀 프로세서 버전을 만들면 Document AI가 기본 구성을 복제하여 새 버전에 연결합니다.

검사를 사용 설정하면 정의된 모든 검사 규칙의 결과가 동기식 및 일괄 요청 모두에 대한 ProcessDocument 응답에 포함됩니다. 수정은 검사도 사용 설정된 경우에만 사용 설정할 수 있습니다. Document AI는 특정 문서에 대해 하나 이상의 검사 규칙이 실패한 경우에만 수정 프로세스를 실행합니다. 수정 후 Document AI는 검사 프로세스를 다시 실행하여 최종 결과를 제공합니다. 수정 전후 검사 결과는 수정 목록의 processDocument 응답에서 확인할 수 있습니다.

CEL 검사 규칙

검사 규칙은 Common Expression Language (CEL)를 기반으로 하는 표현식을 사용하여 정의됩니다. CEL은 단순성과 안전성을 위해 설계된 비튜링 완전 표현식 언어입니다. 정의할 수 있는 규칙의 예는 다음과 같습니다.

  • 필드 A의 합계가 필드 B와 같습니다.
  • 필드 B가 지정된 정규 표현식 패턴과 일치합니다.
  • 모든 상위 항목의 모든 하위 필드가 가로로 정렬됩니다.

규칙 생성을 간소화하려면 자연어로 프롬프트를 제공하여 CEL 규칙을 생성하세요. 이 접근 방식을 사용하면 CEL 구문의 복잡성을 피할 수 있습니다. CEL의 Document AI 구현은 표준 사양과 약간 다를 수 있습니다. 자세한 설명과 예시는 CEL 규칙 참조를 참고하세요.

콘솔에서 검사 활성화 Google Cloud

  1. 기존 프로세서의 Google Cloud 콘솔에서 검사 및 수정 항목을 선택합니다.

    ce-validation-1

  2. 문서를 처리하기 전에 규칙 관리 로 이동합니다.

    ce-validation-2

  3. 검사 사용 설정 전환 버튼을 선택합니다.

  4. 선택사항: 수정 사용 설정 전환 버튼을 선택합니다.

규칙 생성

  1. 규칙 추가 를 클릭합니다.

    ce-validation-6

  2. 규칙 생성 양식에 자연어 프롬프트를 입력합니다.

    ce-validation-5

  3. 규칙에 이름을 지정하고 Common Expression Language (CEL)를 사용하여 동작을 정의합니다.

  4. 선택사항입니다. 수정 또는 삭제 옵션을 사용하여 기존 규칙을 관리합니다.

프로세서 간 구성 복사

  1. 규칙 관리 섹션에서 다른 PV에 복사 를 클릭합니다.

    ce-validation-4

  2. 구성을 복사할 프로세서 이름과 버전을 선택합니다.

    ce-validation-3

규칙 결과

  1. 데이터 세트 관리 페이지에서 규칙 관리 로 이동합니다.

    ce-validation-7

  2. 통과한 테스트와 실패한 테스트의 총수를 평가합니다.

  3. 개별 규칙 결과의 분석을 확인합니다.

  4. 변경사항을 비교하여 수정 후 생성된 새 항목을 녹색으로, 수정된 항목을 노란색으로 확인할 수 있습니다.

    ce-validation-8

  5. 평가 및 테스트 섹션에는 수정을 활성화하기 전후의 점수 열이 표시됩니다.

    ce-validation-9

평가

프로세서 버전 평가에는 수정이 사용 설정된 경우 수정 후 결과와 수정 전 결과 모두에 대한 주요 측정항목이 포함됩니다. 이러한 측정항목을 사용하여 수정 프로세스가 추출 품질에 미치는 영향을 평가합니다.

다음 단계