Ringkasan rekomendasi

Sistem rekomendasi adalah salah satu penerapan teknologi machine learning yang paling sukses dan luas untuk bisnis. Anda dapat menggunakan sistem rekomendasi untuk membantu pengguna menemukan konten yang menarik dalam banyak konten. Misalnya, Google Play Store menawarkan jutaan aplikasi, sedangkan YouTube menawarkan miliaran video, dengan lebih banyak aplikasi dan video yang ditambahkan setiap hari. Pengguna dapat menggunakan penelusuran untuk menemukan konten baru, tetapi cara ini dibatasi oleh istilah penelusuran yang mereka gunakan. Sistem rekomendasi dapat menyarankan konten yang mungkin tidak terpikirkan oleh pengguna untuk ditelusuri sendiri. Untuk mengetahui informasi selengkapnya, lihat Ringkasan Sistem Rekomendasi.

Algoritma machine learning dalam sistem rekomendasi biasanya diklasifikasikan ke dalam kategori berikut:

  • Penyaringan berbasis konten: menggunakan kesamaan antar-item untuk memberikan rekomendasi. Misalnya, jika pengguna menonton dua video kucing lucu, sistem rekomendasi dapat merekomendasikan lebih banyak video hewan lucu kepada pengguna tersebut.
  • Penyaringan kolaboratif: menggunakan kesamaan antar-pengguna (berdasarkan kueri pengguna) untuk memberikan rekomendasi. Misalnya, jika pengguna A menelusuri hal-hal yang serupa dengan pengguna B, dan pengguna B menyukai video 1, maka sistem rekomendasi dapat merekomendasikan video 1 kepada pengguna A, meskipun pengguna A belum menonton video yang serupa dengan video 1.

Model faktorisasi matriks

Model faktorisasi matriks banyak digunakan sebagai metode penyaringan kolaboratif untuk sistem rekomendasi.

Dalam model faktorisasi matriks, pasangan item pengguna dipetakan ke matriks dua dimensi, dengan pengguna unik pada satu sumbu dan item unik pada sumbu lainnya. Rating yang diberikan pengguna untuk item berada di sel matriks. Matriks ini tidak harus terisi sepenuhnya; sebagian besar waktu, pengguna tidak akan memiliki nilai untuk setiap item. Tujuan model faktorisasi matriks adalah membuat dua matriks bobot padat yang lebih kecil yang jika dikalikan bersama, mendekati nilai sel matriks asli dan memberikan prediksi rating untuk sel matriks kosong.

Salah satu matriks yang lebih kecil berisi pengguna unik pada satu sumbu dan jumlah faktor laten pada sumbu lainnya, seperti yang ditentukan oleh opsi NUM_FACTORS pernyataan CREATE MODEL. Matriks kecil lainnya berisi item unik pada satu sumbu dan jumlah faktor laten pada sumbu lainnya. Dalam matriks ini, bobot faktor laten dihasilkan oleh algoritma yang digunakan untuk melatih model, berdasarkan kombinasi item pengguna dari matriks input.

Untuk mengetahui informasi selengkapnya, lihat Faktorisasi Matriks.

Anda dapat menggunakan model faktorisasi matriks dengan fungsi ML.RECOMMEND untuk membuat rekomendasi.

Model lain untuk rekomendasi

Untuk memperluas sistem rekomendasi berbasis pemfilteran kolaboratif di luar yang mungkin dilakukan dengan model faktorisasi matriks, Anda dapat menggunakan model jaringan neural dalam (DNN) dan Wide-and-Deep dengan fungsi ML.PREDICT untuk membuat rekomendasi. Model ini dapat menggabungkan fitur kueri dan item untuk meningkatkan relevansi rekomendasi. Untuk informasi selengkapnya, lihat referensi berikut:

Dengan menggunakan setelan default dalam pernyataan CREATE MODEL dan fungsi inferensi, Anda dapat membuat dan menggunakan model rekomendasi meskipun tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang pengembangan ML, dan model rekomendasi khususnya, akan membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan pemahaman tentang teknik dan proses ML: