Please use this identifier to cite or link to this item:
http://ir-ithesis.swu.ac.th/dspace/handle/123456789/2237
Title: | CLASSIFICATION OF BANKING PRODUCTS FROM THAI TEXTUSING A SEMI-SUPERVISED LEARNING การจำแนกประเภทของผลิตภัณฑ์ธนาคารจากข้อความภาษาไทยด้วยวิธีการเรียนรู้แบบกึ่งมีผู้สอน |
Authors: | AMORNKARN JAIDEE อมรกานต์ ใจดี Subhorn Khonthapagdee ศุภร คนธภักดี Srinakharinwirot University Subhorn Khonthapagdee ศุภร คนธภักดี subhorn@swu.ac.th subhorn@swu.ac.th |
Keywords: | การวิเคราะห์ข้อความ, การประมวลผลภาษาธรรมชาติ, เทคนิคการเรียนรู้แบบกึ่งมีผู้สอน Text Analytics; Natural Language Processing; Semi-supervised Learning |
Issue Date: | 19 |
Publisher: | Srinakharinwirot University |
Abstract: | The purpose of this research is to classify complaints about banking products using semi-supervised machine learning methods. In this research, customer complaints were obtained from Web scraping by using Selenium to retrieve data from www.pantip.com. The data was extracted as of July 13, 2022, with a total of 600 posts. Natural language processing techniques were used to prepare the data. Currently, all comments and complaints are primarily screened by humans. Consequently, there is a significant delay in this process. The experiments were performed using three models: Support Vector Machine (SVM), Logistic Regression (LR), and Naïve Bayes (NB). The best accuracy was achieved by SVM, with an accuracy of 0.82. The LR and NB models was having an accuracy of 0.78 and 0.74, respectively. งานวิจัยนี้มีวัตถุประสงค์เพื่อให้สามารถจำแนกประเภทของผลิตภัณฑ์ธนาคารด้วยวิธีการเรียนรู้แบบกึ่งมีผู้สอน จากข้อความของการแสดงความคิดเห็น การขอความอนุเคราะห์ หรือการร้องเรียนจากลูกค้า ที่ได้จากการทำ Web scraping โดยใช้ชุดคำสั่ง Selenium ในการดึงข้อมูลจากเว็บไซต์ www.pantip.com ที่ได้ทำการดึงข้อมูล ณ วันที่ 13 กรกฎาคม 2565 ซึ่งมีจำนวนกระทู้ทั้งหมด 600 กระทู้ และใช้เทคนิคการประมวลผลภาษาธรรมชาติในการเตรียมความพร้อมของข้อมูล ในความเป็นจริงการที่จะระบุประเภทของผลิตภัณฑ์ธนาคารเป็นเรื่องที่ต้องใช้ทรัพยากรคน และเวลาจำนวนมาก ดังนั้นผู้วิจัยจึงได้แบ่งข้อมูลออกเป็นข้อมูลที่มีการระบุและไม่ระบุประเภทของผลิตภัณฑ์ธนาคารไว้ และใช้เทคนิคการเรียนรู้แบบกึ่งมีผู้สอนในการฝึกฝนแบบจำลอง และทำการทดลองโดยใช้้เทคนิคการประมวลผลธรรมชาติ 3 แบบจำลอง ประกอบด้วย Support Vector Machine (SVM), Logistic Regression (LR) และ Naïve Bayes (NB) จากการทดลองพบว่าแบบจำลองที่มีประสิทธิภาพในการจำแนกประเภทของผลิตภัณฑ์ธนาคารได้ดีที่สุดคือ SVM โดยมีความแม่นยำอยู่ที่ 0.82 โดยแบบจำลอง LR และ NB จะมีความแม่นยำอยู่ที่ 0.78 และ 0.74 ตามลำดับ |
URI: | http://ir-ithesis.swu.ac.th/dspace/handle/123456789/2237 |
Appears in Collections: | Faculty of Science |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
gs641130076.pdf | 2.72 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.