SPEECH RECOGNITION SYSTEM FOR HEARING DISABILITYUSING NEURAL NETWORK

dc.contributorKANUT PUENGSIRICHAROENen
dc.contributorคณุตม์ ปึงศิริเจริญth
dc.contributor.advisorDirek Sueseenaken
dc.contributor.advisorดิเรก เสือสีนาคth
dc.contributor.coadvisorDirek Sueseenaken
dc.contributor.coadvisorดิเรก เสือสีนาคth
dc.contributor.emailadvisordireks@swu.ac.th
dc.contributor.emailcoadvisordireks@swu.ac.th
dc.contributor.otherSrinakharinwirot Universityen
dc.date.accessioned2026-05-05T05:22:36Z
dc.date.created2021
dc.date.issued16/8/2021
dc.description.abstractListening is one of the most important skills in learning human languages and in speech. However, some people have a disability in communicating with others for many reasons. One of the main causes of speech impairment is hearing impairment or hearing loss. This research proposes a speech recognition system for rehabilitation of communication in people with bilateral cochlear implant surgery. It includes the 66 words for the rehabilitation of communication. The Mel-Frequency Cepstal Coefficient (MFCC) was used for speech feature extraction. The Convolutional Neural Network (CNN), Artificial Neural Network (ANN), Neural Network (NN) and K-Nearest Neighbor (KNN) were used for speech classification. Based on the test results of the 10 classes and 20 classes datasets, the ANN algorithm achieved the highest accuracy compared to other algorithms, which were at 97.78% and 86.11%, respectively. For 30 classes, 40 classes, 50 classes, 60 classes and 66 classes datasets, the KNN algorithm achieved the highest accuracy compared to other algorithms, which were at 89.63%, 81.67%, 82.67%, 85.37% and 80.98%, respectively.en
dc.description.abstractการฟัง ถือเป็นทักษะหนึ่งที่สำคัญในการเรียนรู้ภาษาและการพูดของมนุษย์ หากเกิดความบกพร่องในการติดต่อสื่อสารกับผู้อื่นอาจเกิดจากหลายสาเหตุ แต่สาเหตุสำคัญที่ทำให้เกิดความบกพร่องทางการพูดคือ การบกพร่องทางการฟังหรือการสูญเสียการได้ยิน ในงานวิจัยนี้จึงนำเสนอระบบรู้จำเสียงสำหรับฟื้นฟูการสื่อสารของคนที่ผ่าตัดประสาทหูเทียมทั้งหูสองข้าง ซึ่งมีคำศัพท์สำหรับฟื้นฟูการสื่อสารจำนวน 66 คำ สำหรับการหาลักษณะสำคัญของเสียงด้วยวิธี สัมประสิทธิ์เซปสตรัมของเมล (Mel-Frequency Cepstal Coefficient: MFCC) และสำหรับการจำแนกเสียงต่างๆ ด้วยวิธีการ โครงข่ายประสาทแบบคอนโวลูชัน (Convolutional Neural Network: CNN), โครงข่ายประสาทเทียม (Artificial Neural Network: ANN), โครงข่ายประสาท (Neural Network: NN) และการเรียนรู้เพื่อนบ้านที่ใกล้ที่สุด (K-Nearest Neighbor: KNN)  จากผลการทดสอบด้วยชุดข้อมูลเสียงที่แบ่งเป็น 10 กลุ่มข้อมูล และ 20 กลุ่มข้อมูล วิธีการ ANN ได้ค่าความถูกต้องสูงที่สุดเมื่อเปรียบเทียบกับวิธีการอื่นๆ คือ 97.78% และ 86.11% ตามลำดับ สำหรับชุดข้อมูลเสียงที่แบ่งเป็น 30 กลุ่มข้อมูล, 40 กลุ่มข้อมูล, 50 กลุ่มข้อมูล, 60 กลุ่มข้อมูล และ 66 กลุ่มข้อมูล วิธีการ KNN ได้ค่าความถูกต้องสูงที่สุดเมื่อเปรียบเทียบกับวิธีการอื่นๆ คือ 89.63%, 81.67%, 82.67%, 85.37% และ 80.98% ตามลำดับth
dc.description.degreelevel-en
dc.description.degreelevel-th
dc.description.degreenameMASTER OF ENGINEERING (M.Eng.)en
dc.description.degreenameวิศวกรรมศาสตรมหาบัณฑิต (วศ.ม.)th
dc.identifier.urihttps://ir-ithesis.swu.ac.th/handle/123456789/3459
dc.language.isoth
dc.publisherSrinakharinwirot University
dc.rightsSrinakharinwirot University
dc.subjectการสูญเสียการได้ยินth
dc.subjectผ่าตัดประสาทหูเทียมth
dc.subjectสัมประสิทธิ์เซปสตรัมของเมลth
dc.subjectโครงข่ายประสาทเทียมth
dc.subjectHearing lossen
dc.subjectCochlear implanten
dc.subjectMel-Frequency Cepstal Coefficienten
dc.subjectArtificial neural networksen
dc.subject.classificationEngineeringen
dc.subject.classificationProfessional, scientific and technical activitiesen
dc.subject.classificationMedical diagnostic and treatment technologyen
dc.titleSPEECH RECOGNITION SYSTEM FOR HEARING DISABILITYUSING NEURAL NETWORKen
dc.titleระบบรู้จำเสียงสำหรับผู้พิการทางการได้ยินโดยใช้โครงข่ายประสาทเทียมth
dc.typeThesisen
dc.typeปริญญานิพนธ์th

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
gs631110127.pdf
Size:
6.17 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
160 B
Format:
Plain Text
Description: