Please use this identifier to cite or link to this item: http://ir-ithesis.swu.ac.th/dspace/handle/123456789/2233
Title: MUSHROOM CLASSIFICATION BETWEEN POISONOUS AND EDIBLE MUSHROOMS USING MACHINE LEARNING TECHNIQUES
การจำแนกประเภทของเห็ดระหว่างเห็ดมีพิษหรือไม่มีพิษ โดยใช้เทคนิคการเรียนรู้ของเครื่อง
Authors: PHIROMPORN TIANMITRAPAP
ภิรมย์พร เถี่ยนมิตรภาพ
Waraporn Viyanon
วราภรณ์ วิยานนท์
Srinakharinwirot University
Waraporn Viyanon
วราภรณ์ วิยานนท์
waraporn@swu.ac.th
waraporn@swu.ac.th
Keywords: การจำแนกประเภทเห็ด
เทคนิคการเรียนรู้ของเครื่อง
การคัดเลือกฟีเจอร์
การสกัดฟีเจอร์
เว็บแอปพลิเคชัน
เทคนิคการวิเคราะห์องค์ประกอบหลัก
ต้นไม้การตัดสินใจ
Mushroom classification
Machine Learning
Feature selection
Recursive Feature Elimination
Feature extraction
Chi-square
Principal Component Analysis
Decision Tree
F1 score
Web application
Issue Date:  19
Publisher: Srinakharinwirot University
Abstract: Mushrooms are a type of natural fungi that can either be edible or poisonous. Consuming poisonous mushrooms can lead to severe illness or even death. Therefore, machine learning techniques and models have been used to classify mushrooms into edible and poisonous types. This study explores the effectiveness of five machine learning models, including Logistic regression, SVM, Decision tree, Random Forest, and XGBoost, along with feature selection techniques to identify the most significant features to indicate the type of mushroom. Recursive Feature Elimination (RFE) and Chi-square feature selection techniques were used to select important features, while Principal Component Analysis (PCA) was used for feature extraction. The results showed that both RFE and the Chi-square feature selection techniques increased the cross-validation score as the number of features increased. Additionally, the PCA technique increased the cross-validation score as the number of components increased. After comparing the results of the models, it was found that the Decision tree model, which used RFE feature selection technique with a training size of 60%, and only three features, namely odor, gill size, and spore print color, yielded the highest F1 score of 99.32%. This model was then used to develop a prototype web application for mushroom classification.
เห็ดตามธรรมชาติมีทั้งเห็ดที่รับประทานได้และเห็ดที่มีพิษ หากคนรับประทานเห็ดพิษเข้าไปทำให้เกิดอาการเจ็บป่วยและถึงแก่ชีวิตได้ ดังนั้นจึงได้นำเทคนิคการเรียนรู้ของเครื่องมาใช้ในการจำแนกประเภทของเห็ดระหว่างเห็ดพิษและเห็ดที่รับประทานได้โดยใช้แบบจำลอง 5 แบบจำลอง ได้แก่ Logistic regression, SVM, Decision tree, Random Forest และ XGBoost ร่วมกับการใช้เทคนิคการคัดเลือกและสกัดฟีเจอร์ เพื่อค้นหาฟีเจอร์ที่สำคัญที่สามารถบ่งบอกประเภทของเห็ดได้ โดยผลการศึกษาพบว่า การคัดเลือกฟีเจอร์ทั้ง RFE และ Chi-square เมื่อจำนวนฟีเจอร์เพิ่มขึ้น ค่า cross validation score เพิ่มขึ้น และคงที่เมื่อจำนวนฟีเจอร์เท่ากับ 3 ฟีเจอร์ สำหรับเทคนิคการสกัดฟีเจอร์ด้วย PCA นั้นเมื่อจำนวน component เพิ่มขึ้น ค่า cross validation score เพิ่มขึ้น และคงที่เมื่อจำนวน component เท่ากับ 3 components เมื่อพิจารณาผลลัพธ์พบว่าการใช้แบบจำลอง Decision tree ที่ใช้เทคนิค Recursive Feature Elimination (RFE) ในการคัดเลือกฟีเจอร์โดยใช้ training size เท่ากับ 60% และใช้ฟีเจอร์เพียง 3 ฟีเจอร์ได้แก่ กลิ่นของเห็ด (odor) ขนาดครีบเห็ด (gill_size) และสีรอยพิมพ์สปอร์ (spore_print_color) มีความเหมาะสมที่สุดโดยได้ F1 score เท่ากับ 99.32% ซึ่งนำโมเดลที่ได้ไปสร้างต้นแบบเว็บแอปพลิเคชัน
URI: http://ir-ithesis.swu.ac.th/dspace/handle/123456789/2233
Appears in Collections:Faculty of Science

Files in This Item:
File Description SizeFormat 
gs641130063.pdf6.59 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.