문서 처리 함수 선택
이 문서에서는 BigQuery ML에서 사용할 수 있는 문서 처리 함수(ML.GENERATE_TEXT
, ML.PROCESS_DOCUMENT
)를 비교합니다.
이 문서의 정보를 사용하여 함수에 겹치는 기능이 있는 경우에 사용할 함수를 결정할 수 있습니다.
간략한 이러한 함수의 차이점은 다음과 같습니다.
ML.GENERATE_TEXT
는 일부 콘텐츠가 문서에 있는 자연어 처리(NLP) 태스크를 수행하는 데 적합합니다. 이 함수는 다음과 같은 이점을 제공합니다.- 비용 절감
- 더 많은 언어 지원
- 처리량 증가
- 모델 튜닝 기능
- 멀티모달 모델 사용 가능
이 접근 방식이 가장 효과적인 문서 처리 태스크의 예는 Gemini API를 사용한 문서 처리 기능 살펴보기를 참조하세요.
ML.PROCESS_DOCUMENT
는 문서 파싱 및 사전 정의된 구조화된 응답이 필요한 문서 처리 태스크를 수행하는 데 적합합니다.
함수 비교
다음 표를 사용하여 ML.GENERATE_TEXT
및 ML.PROCESS_DOCUMENT
함수를 비교하세요.
ML.GENERATE_TEXT |
ML.PROCESS_DOCUMENT |
|
---|---|---|
목적 | Gemini 또는 파트너 모델이나 개방형 모델에 프롬프트를 전달하여 문서 관련 NLP 작업을 실행합니다. 회사의 재무 문서를 예로 들면 |
Document AI API를 사용하여 인보이스, 세금 양식, 재무제표와 같은 다양한 문서 유형에 대한 특수 문서 처리를 수행합니다. 문서 청크 처리도 수행할 수 있습니다. |
결제 | 처리된 데이터에 대해 BigQuery ML 요금이 발생합니다. 자세한 내용은 BigQuery ML 가격 책정을 참고하세요. |
처리된 데이터에 대해 BigQuery ML 요금이 발생합니다. 자세한 내용은 BigQuery ML 가격 책정을 참고하세요.
Document AI API 호출에 대한 요금이 발생합니다. 자세한 내용은 Document AI API 가격 책정을 참고하세요. |
분당 요청 수 (RPM) | Gemini 모델에는 적용되지 않습니다. 파트너 모델의 경우 25~60 자세한 내용은 분당 요청 수 한도를 참고하세요. | 프로세서 유형당 120RPM, 프로젝트당 전체 한도 600RPM 자세한 내용은 할당량 목록을 참고하세요. |
분당 토큰 수 | 사용된 모델에 따라 8,192~100만 이상입니다. | 토큰 한도가 없습니다. 하지만 이 함수는 사용하는 프로세서에 따라 페이지 한도가 다릅니다. 자세한 내용은 한도를 참고하세요. |
감독하에 조정 | 일부 모델에서 지도 조정이 지원됩니다. | 지원되지 않음. |
지원 언어 | 지원 여부는 선택한 LLM에 따라 다릅니다. | 언어 지원은 문서 프로세서 유형에 따라 다릅니다. 대부분은 영어만 지원합니다. 자세한 내용은 프로세서 목록을 참고하세요. |
지원되는 리전 | Vertex AI용 생성형 AI의 모든 리전에서 지원됩니다. | 모든 프로세서에 대해 EU 및 US 멀티 리전에서 지원됩니다. 일부 프로세서는 특정 단일 리전에서도 사용할 수 있습니다. 자세한 내용은 리전 및 멀티 리전 지원을 참고하세요. |