Ringkasan analisis kontribusi
Gunakan dokumen ini untuk memahami kasus penggunaan analisis kontribusi, dan opsi untuk melakukan analisis kontribusi di BigQuery ML.
Apa yang dimaksud dengan analisis kontribusi?
Analisis kontribusi, yang juga disebut analisis pendorong utama, adalah metode yang digunakan untuk menghasilkan insight tentang perubahan pada metrik utama dalam data multi-dimensi Anda. Misalnya, Anda dapat menggunakan analisis kontribusi untuk melihat data apa yang berkontribusi pada perubahan angka pendapatan di dua kuartal, atau untuk membandingkan dua set data pelatihan guna memahami perubahan dalam performa model ML.
Analisis kontribusi adalah bentuk analisis tambahan, yaitu penggunaan kecerdasan buatan (AI) untuk meningkatkan dan mengotomatiskan analisis dan pemahaman data. Analisis kontribusi mencapai salah satu tujuan utama analisis tambahan, yaitu membantu pengguna menemukan pola dalam data mereka.
Analisis kontribusi dengan BigQuery ML
Analisis kontribusi mendeteksi segmen data yang menunjukkan perubahan dalam metrik tertentu dengan membandingkan set data pengujian dengan set data kontrol. Misalnya, Anda dapat menggunakan snapshot tabel data penjualan yang diambil pada akhir tahun 2023 sebagai data pengujian dan snapshot tabel yang diambil pada akhir tahun 2022 sebagai data kontrol, lalu membandingkannya untuk melihat perubahan penjualan Anda dari waktu ke waktu. Analisis kontribusi dapat menunjukkan segmen data mana, seperti pelanggan online di wilayah tertentu, yang mendorong perubahan terbesar dalam penjualan dari satu tahun ke tahun berikutnya.
Metrik adalah nilai numerik yang digunakan model analisis kontribusi untuk mengukur dan membandingkan perubahan antara data pengujian dan kontrol. Anda dapat menentukan jenis metrik berikut dengan model analisis kontribusi:
- Dapat dijumlahkan: menjumlahkan nilai kolom metrik yang Anda tentukan, lalu menentukan total untuk setiap segmen data.
- Rasio yang dapat dijumlahkan: menjumlahkan nilai dua kolom numerik yang Anda tentukan, dan menentukan rasio di antara keduanya untuk setiap segmen data.
- Dapat dijumlahkan menurut kategori: menjumlahkan nilai kolom numerik dan membaginya dengan jumlah nilai berbeda dari kolom kategori.
Segmen adalah bagian data yang diidentifikasi oleh kombinasi nilai dimensi tertentu. Misalnya, untuk model analisis kontribusi berdasarkan dimensi store_number, customer_id, dan day, setiap kombinasi unik dari nilai dimensi tersebut mewakili segmen. Dalam tabel berikut, setiap baris mewakili segmen yang berbeda:
store_number |
customer_id |
day |
| toko 1 | ||
| toko 1 | pelanggan 1 | |
| toko 1 | pelanggan 1 | Senin |
| toko 1 | pelanggan 1 | Selasa |
| toko 1 | pelanggan 2 | |
| toko 2 |
Menganalisis data tanpa model
Jika Anda memiliki kurang dari 12 dimensi dan menggunakan metrik yang dapat dijumlahkan, Anda
dapat melakukan analisis kontribusi menggunakan
AI.KEY_DRIVERS TVF.
Untuk sebagian besar aplikasi, sebaiknya gunakan fungsi AI.KEY_DRIVERS daripada membuat model karena fungsi ini menawarkan sintaksis yang disederhanakan, hasil yang lebih cepat, dan pemangkasan otomatis. Output fungsi terdiri dari baris insight, dengan setiap insight sesuai dengan segmen dan memberikan metrik yang sesuai dengan segmen tersebut.
Menggunakan model analisis kontribusi
Jika memerlukan lebih dari 12 dimensi atau jenis
metrik lainnya, Anda dapat membuat model analisis kontribusi dengan
CREATE MODEL pernyataan.
Untuk mengurangi waktu pembuatan model, tentukan nilai minimum dukungan apriori . Nilai minimum dukungan apriori memungkinkan Anda memangkas segmen kecil dan kurang relevan sehingga model hanya menggunakan segmen terbesar dan paling relevan.
Setelah membuat model analisis kontribusi, Anda dapat menggunakan fungsi
ML.GET_INSIGHTSuntuk mengambil informasi metrik yang dihitung oleh model.
Output fungsi terdiri dari baris insight, dengan setiap insight sesuai dengan segmen dan memberikan metrik yang sesuai dengan segmen tersebut.
Perjalanan pengguna analisis kontribusi
Tabel berikut menjelaskan pernyataan dan fungsi yang dapat Anda gunakan dengan analisis kontribusi:
| Pernyataan atau fungsi | Pra-pemrosesan fitur | Pemerolehan insight | Tutorial |
|---|---|---|---|
AI.KEY_DRIVERS |
Pra-pemrosesan manual | T/A | Contoh analisis kontribusi pada data penjualan minuman beralkohol di Iowa |
CREATE MODEL |
Pra-pemrosesan manual | ML.GET_INSIGHTS |