문서 처리 함수 선택

이 문서에서는 BigQuery ML에서 사용할 수 있는 문서 처리 함수(ML.GENERATE_TEXT, ML.PROCESS_DOCUMENT)를 비교합니다. 이 문서의 정보를 사용하여 함수에 겹치는 기능이 있는 경우에 사용할 함수를 결정할 수 있습니다.

간략한 이러한 함수의 차이점은 다음과 같습니다.

  • ML.GENERATE_TEXT는 일부 콘텐츠가 문서에 있는 자연어 처리(NLP) 태스크를 수행하는 데 적합합니다. 이 함수는 다음과 같은 이점을 제공합니다.

    • 비용 절감
    • 더 많은 언어 지원
    • 처리량 증가
    • 모델 튜닝 기능
    • 멀티모달 모델 사용 가능

    이 접근 방식이 가장 효과적인 문서 처리 태스크의 예는 Gemini API를 사용한 문서 처리 기능 살펴보기를 참조하세요.

  • ML.PROCESS_DOCUMENT는 문서 파싱 및 사전 정의된 구조화된 응답이 필요한 문서 처리 태스크를 수행하는 데 적합합니다.

함수 비교

다음 표를 사용하여 ML.GENERATE_TEXTML.PROCESS_DOCUMENT 함수를 비교하세요.

ML.GENERATE_TEXT ML.PROCESS_DOCUMENT
목적

Gemini 또는 파트너 모델이나 개방형 모델에 프롬프트를 전달하여 문서 관련 NLP 작업을 실행합니다.

회사의 재무 문서를 예로 들면 What is the quarterly revenue for each division?과 같은 프롬프트를 제공하여 문서 정보를 검색할 수 있습니다.

Document AI API를 사용하여 인보이스, 세금 양식, 재무제표와 같은 다양한 문서 유형에 대한 특수 문서 처리를 수행합니다. 문서 청크 처리도 수행할 수 있습니다.
결제

처리된 데이터에 대해 BigQuery ML 요금이 발생합니다. 자세한 내용은 BigQuery ML 가격 책정을 참고하세요.

모델 호출에 대한 Vertex AI 요금이 발생합니다. Gemini 2.0 이상 모델을 사용하는 경우 호출은 배치 API 요금으로 청구됩니다. 자세한 내용은 Vertex AI에서 AI 모델을 빌드하고 배포하는 데 드는 비용을 참고하세요.

처리된 데이터에 대해 BigQuery ML 요금이 발생합니다. 자세한 내용은 BigQuery ML 가격 책정을 참고하세요.

Document AI API 호출에 대한 요금이 발생합니다. 자세한 내용은 Document AI API 가격 책정을 참고하세요.

분당 요청 수 (RPM) Gemini 모델에는 적용되지 않습니다. 파트너 모델의 경우 25~60 자세한 내용은 분당 요청 수 한도를 참고하세요. 프로세서 유형당 120RPM, 프로젝트당 전체 한도 600RPM 자세한 내용은 할당량 목록을 참고하세요.
분당 토큰 수 사용된 모델에 따라 8,192~100만 이상입니다. 토큰 한도가 없습니다. 하지만 이 함수는 사용하는 프로세서에 따라 페이지 한도가 다릅니다. 자세한 내용은 한도를 참고하세요.
감독하에 조정 일부 모델에서 지도 조정이 지원됩니다. 지원되지 않음.
지원 언어 지원 여부는 선택한 LLM에 따라 다릅니다. 언어 지원은 문서 프로세서 유형에 따라 다릅니다. 대부분은 영어만 지원합니다. 자세한 내용은 프로세서 목록을 참고하세요.
지원되는 리전 Vertex AI용 생성형 AI의 모든 리전에서 지원됩니다. 모든 프로세서에 대해 EUUS 멀티 리전에서 지원됩니다. 일부 프로세서는 특정 단일 리전에서도 사용할 수 있습니다. 자세한 내용은 리전 및 멀티 리전 지원을 참고하세요.