기여 분석 개요

이 문서를 사용하여 기여 분석 사용 사례와 BigQuery ML에서 기여 분석을 실행하는 옵션을 이해합니다.

기여 분석이란 무엇인가요?

기여 분석(핵심 동인 분석이라고도 함)은 다차원 데이터의 주요 측정항목 변경에 관한 통계를 생성하는 데 사용되는 방법입니다. 예를 들어 기여 분석을 사용하여 두 분기에 걸쳐 수익 수치 변경에 기여한 데이터를 확인하거나 두 학습 데이터 세트를 비교하여 ML 모델의 성능 변화를 파악할 수 있습니다.

기여 분석은 인공지능 (AI)을 사용하여 데이터의 분석 및 이해를 개선하고 자동화하는 증강 분석의 한 형태입니다. 기여 분석은 사용자가 데이터에서 패턴을 찾을 수 있도록 지원하는 증강 분석의 주요 목표 중 하나를 달성합니다.

BigQuery ML을 사용한 기여 분석

기여 분석은 데이터의 테스트 세트를 데이터의 통제 세트와 비교하여 지정된 측정항목의 변화를 보여주는 데이터 세그먼트를 감지합니다. 예를 들어 2023년 말에 수집된 판매 데이터의 테이블 스냅샷을 테스트 데이터로 사용하고 2022년 말에 수집된 테이블 스냅샷을 통제 데이터로 사용하여 시간 경과에 따른 판매 변화를 비교할 수 있습니다. 기여 분석은 전년 대비 판매에 가장 큰 변화를 가져온 데이터 세그먼트(특정 지역의 온라인 고객 등)를 보여줄 수 있습니다.

측정항목 은 기여 분석 모델이 테스트 데이터와 통제 데이터 간의 변화를 측정하고 비교하는 데 사용하는 숫자 값입니다. 기여 분석 모델을 사용하여 다음 유형의 측정항목을 지정할 수 있습니다.

  • 합산 가능: 지정한 측정항목 열의 값을 합산한 후 데이터의 각 세그먼트에 대한 합계를 확인합니다.
  • _합산 가능한 비율_: 지정한 두 개의 숫자 열의 값을 합산하고 데이터의 각 세그먼트에 대한 비율을 확인합니다.
  • 카테고리별 합산 가능: 숫자 열의 값을 합산하고 카테고리 열의 고유 값 수로 나눕니다.

세그먼트 는 지정된 측정기준 값 조합으로 식별되는 데이터 슬라이스입니다. 예를 들어 store_number, customer_id, day 측정기준을 기반으로 하는 기여 분석 모델의 경우 이러한 측정기준 값의 모든 고유 조합이 세그먼트를 나타냅니다. 다음 표에서 각 행은 서로 다른 세그먼트를 나타냅니다.

store_number customer_id day
매장 1
매장 1 고객 1
매장 1 고객 1 월요일
매장 1 고객 1 화요일
매장 1 고객 2
매장 2

모델 없이 데이터 분석

측정기준이 12개 미만이고 합산 가능한 측정항목을 사용하는 경우 기여 분석을 실행할 수 있습니다 . AI.KEY_DRIVERS TVF를 사용하여 대부분의 애플리케이션에서는 모델을 만드는 것보다 AI.KEY_DRIVERS 함수를 사용하는 것이 좋습니다. 간소화된 구문, 빠른 결과, 자동 가지치기를 제공하기 때문입니다. 함수 출력은 인사이트 행으로 구성되며 각 인사이트는 세그먼트에 해당하고 세그먼트의 해당 측정항목을 제공합니다.

기여 분석 모델 사용

반복 분석을 실행하거나 12개 이상의 측정기준 또는 다른 유형 의 측정항목이 필요한 경우 CREATE MODEL을 사용하여 기여 분석 모델을 만들 수 있습니다.

모델 생성 시간을 줄이려면 Apriori 지원 기준점을 지정하세요. Apriori 지원 기준점을 사용하면 작고 관련성이 낮은 세그먼트를 프루닝하여 모델이 가장 크고 관련성이 높은 세그먼트만 사용하도록 할 수 있습니다.

기여 분석 모델을 만든 후에는 ML.GET_INSIGHTS 함수 를 사용하여 모델에서 계산한 측정항목 정보를 가져올 수 있습니다. 함수 출력은 인사이트 행으로 구성되며 각 인사이트는 세그먼트에 해당하고 세그먼트의 해당 측정항목을 제공합니다.

기여 분석 사용자 여정

다음 표에서는 기여 분석에 사용할 수 있는 문과 함수를 설명합니다.

문 또는 함수 기능 사전 처리 인사이트 생성 튜토리얼
AI.KEY_DRIVERS 수동 사전 처리 해당 사항 없음 아이오와 주류 판매 데이터에 대한 기여 분석 예시
CREATE MODEL 수동 사전 처리 ML.GET_INSIGHTS

다음 단계