BOOK RECOMMENDATION WITH DATA MINING USING RAPIDMINER
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Srinakharinwirot University
Abstract
This research presents the use of the k-Nearest Neighbor (k-NN) and the Matrix Factorization (MF) techniques for a book recommendation system using RapidMiner. The combination of the two techniques and the results were compared and the features used by the techniques were UserID and BookID, and the book ratings were given by users. The experimental results demonstrated that the combination technique achieved the best results with the area under the curve (AUC) at 0.929, precision at k=5 (prec@5) at 0.293, precision at k=10 (prec@10) at 0.229, precision at k=15 (prec@15) at 0.192, Normalized Discounted Cumulative Gain (NDCG) at 0.506 and the resulting Mean Average Precision (MAP) at 0.201.
งานวิจัยนี้นำเสนอการใช้เทคนิคเพื่อนบ้านใกล้เคียงที่สุด k-Nearest Neighbor (k-NN) และเทคนิคการแยกตัวประกอบเมทริกซ์ Matrix Factorization (MF) ในการสร้างแบบจำลองการแนะนำหนังสือด้วยทำโดยใช้ RapidMiner โดยเปรียบเทียบประสิทธิภาพระหว่าง 2 เทคนิคข้างต้น และประสิทธิภาพเทคนิคการทำ Model Combiner ของทั้ง 2 เทคนิค ซึ่งคุณลักษณะเฉพาะที่สำคัญที่นำมาใช้ในการทำเหมืองข้อมูลประกอบไปด้วย ข้อมูลผู้ใช้ (UserID) ข้อมูลหนังสือ (BookID) และข้อมูลการให้คะแนน (Rating) จากผลการวิจัยพบว่าเทคนิคที่มีประสิทธิภาพการทำนายดีที่สุดคือเทคนิค Model Combiner ด้วยค่า Area under the Curve (AUC) ที่ได้คือ 0.929, Precision at k=5 (prec@5) ที่ได้คือ 0.293, Precision at k=10 (prec@10) ที่ได้คือ 0.229, Precision at k=15 (prec@15) ที่ได้คือ 0.192, ค่า Normalized Discounted Cumulative Gain (NDCG) ที่ได้คือ 0.506 และMean Average Precision (MAP) ที่ได้คือ 0.201
งานวิจัยนี้นำเสนอการใช้เทคนิคเพื่อนบ้านใกล้เคียงที่สุด k-Nearest Neighbor (k-NN) และเทคนิคการแยกตัวประกอบเมทริกซ์ Matrix Factorization (MF) ในการสร้างแบบจำลองการแนะนำหนังสือด้วยทำโดยใช้ RapidMiner โดยเปรียบเทียบประสิทธิภาพระหว่าง 2 เทคนิคข้างต้น และประสิทธิภาพเทคนิคการทำ Model Combiner ของทั้ง 2 เทคนิค ซึ่งคุณลักษณะเฉพาะที่สำคัญที่นำมาใช้ในการทำเหมืองข้อมูลประกอบไปด้วย ข้อมูลผู้ใช้ (UserID) ข้อมูลหนังสือ (BookID) และข้อมูลการให้คะแนน (Rating) จากผลการวิจัยพบว่าเทคนิคที่มีประสิทธิภาพการทำนายดีที่สุดคือเทคนิค Model Combiner ด้วยค่า Area under the Curve (AUC) ที่ได้คือ 0.929, Precision at k=5 (prec@5) ที่ได้คือ 0.293, Precision at k=10 (prec@10) ที่ได้คือ 0.229, Precision at k=15 (prec@15) ที่ได้คือ 0.192, ค่า Normalized Discounted Cumulative Gain (NDCG) ที่ได้คือ 0.506 และMean Average Precision (MAP) ที่ได้คือ 0.201
Description
MASTER OF SCIENCE (M.Sc.)
วิทยาศาสตรมหาบัณฑิต (วท.ม.)
วิทยาศาสตรมหาบัณฑิต (วท.ม.)