특성 사전 처리 개요
특성 사전 처리는 머신러닝 수명 주기에서 가장 중요한 단계 중 하나입니다. 특성 생성과 학습 데이터 정리로 구성됩니다. 특성 생성을 특성 추출이라고도 합니다.
BigQuery ML은 다음과 같은 특성 사전 처리 기법을 제공합니다.
자동 사전 처리. BigQuery ML은 학습 중에 자동 사전 처리를 수행합니다. 자세한 내용은 자동 특성 사전 처리를 참조하세요.
수동 사전 처리.
CREATE MODEL
문의TRANSFORM
절을 사용하면 수동 사전 처리 함수를 사용하여 커스텀 사전 처리를 정의할 수 있습니다. 모델을 만들기 전에TRANSFORM
절 외부에서 이러한 함수를 사용하여 학습 데이터를 처리할 수도 있습니다.
특성 정보 가져오기
ML.FEATURE_INFO
함수를 사용하여 모든 입력 특성 열의 통계를 검색할 수 있습니다.
추천 지식
추론 함수와 CREATE MODEL
문의 기본 설정을 사용하면 ML 지식이 많지 않더라도 BigQuery ML 모델을 만들고 사용할 수 있습니다. 하지만 특성 추출 및 모델 학습과 같은 ML 개발 수명 주기에 관한 기본 지식을 갖추면 데이터와 모델을 모두 최적화하여 더 나은 결과를 얻을 수 있습니다. 다음 리소스를 사용하여 ML 기법과 프로세스에 익숙해지는 것이 좋습니다.
다음 단계
- BigQuery ML의 특성 서빙 알아보기
특성 전처리를 지원하는 모델에 지원되는 SQL 문 및 함수에 대한 자세한 내용은 다음 문서를 참고하세요.