IMAGE MEMORABILITY PREDICTION USING DEEP LEARNING

dc.contributorRATTAPORN KUNSOMBATen
dc.contributorรัฐพร คุณสมบัติth
dc.contributor.advisorNapa Sae-Baeen
dc.contributor.advisorนภา แซ่เบ๊th
dc.contributor.coadvisorNapa Sae-Baeen
dc.contributor.coadvisorนภา แซ่เบ๊th
dc.contributor.emailadvisornapasa@swu.ac.th
dc.contributor.emailcoadvisornapasa@swu.ac.th
dc.contributor.otherSrinakharinwirot Universityen
dc.date.accessioned2024-07-11T03:13:00Z
dc.date.available2024-07-11T03:13:00Z
dc.date.created2024
dc.date.issued24/5/2024
dc.description.abstractThe ability to memorize images can be assessed based on the behavior and experiences of individuals, from a psychological perspective on memory, stemming from internal brain stimulation and daily life usage. This research focuses on predicting image memorization using deep learning techniques. In particular, this research employs three types of model architecture: (1) ResNet50 (a 50-layer convolutional neural network) which utilized; (2) ViT (Vision Transformer model); and (3) a hybrid model using ResNet50 and ViT in conjunction to predict memorability scores. These models were trained using three distinct approaches: (1) training from scratch; (2) utilizing the pretrained models; and (3) fine-tuning the pretrained model, in order to compare the performance of the models in image memorization. The result revealed that the pretrained ResNet50 model (without fine-tuning) yielded the best performance compared to other models, with  0.0001 Mean Squared Error (MSE), 0.0082 Mean Absolute Error (MAE), 0.9947 R-square (R2) and a 0.9896 Spearman Correlation Coefficient (Spearman's rho).en
dc.description.abstractความสามารถในการจดจำภาพสามารถวัดได้จากพฤติกรรมและประสบการณ์ของแต่ละบุคคล โดยมุมมองทางจิตวิทยาความจำมาจากการกระตุ้นภายในสมองและการใช้ชีวิตประจำวัน ในงานวิจัยนี้มุ่งศึกษาการสร้างแบบจำลองเพื่อทำนายการจดจำภาพโดยใช้เทคนิคการเรียนรู้เชิงลึก (Deep Learning) โดยรูปแบบของแบบจำลองที่นำมาศึกษาประกอบด้วย 1) สถาปัตยกรรมแบบ ResNet50 ซึ่งเป็นโครงข่ายประสาทเทียมแบบสังวัตนาการ (Convolutional Neural Network, CNN) 2) สถาปัตยกรรมแบบ ViT ซึ่งเป็นโครงข่ายประสาทเทียมแบบทรานฟอร์เมอร์  (Transformer) และ 3) การแบบจำลองผสมผสานที่ได้จาการนำทั้งสองโมเดลมาเชื่อมต่อกันแบบคู่ขนานโดยในการฝึกแบบจำลองแบ่งเป็น 3 แบบ ได้แก่ 1) การฝึกแบบจำลองจากแรกเริ่ม (Trained from scratch)   2) การนำแบบจำลองที่ฝึกมาจากชุดข้อมูลอื่นมาใช้เป็นแบบจำลองเพื่อการคำนวณเวกเตอร์คุณลักษณะ(Pretrained model)  และ 3) การนำฝึกแบบจำลองที่ฝึกมาจากชุดข้อมูลอื่น,มาปรับแต่งเพิ่มเติม (Fine-tuning ) เพื่อเปรียบเทียบประสิทธิภาพโมเดลในการจดจำภาพ โดยจากผลการทดลอง การนำแบบจำลอง ResNet50 ที่ฝึกมาจากชุดข้อมูลอื่นมาใช้เป็นแบบจำลองเพื่อการคำนวณเวกเตอร์คุณลักษณะมาใช้ฝึกในชุดข้อมูลที่มีการคละหมวดหมู่  ให้ผลการทดลองที่ดีที่สุดโดยมีค่าประสิทธิภาพการทำนายคะแนนการจดจำภาพดังนี้ คือ Mean Squared Error (MSE) 0.0001  Mean Absolute Error (MAE) 0.0082   R-square (R2)  0.9947  และ  Spearman Correlation Coefficient (Spearman's rho)   0.9896th
dc.description.degreedisciplineDepartment of Computer Scienceen
dc.description.degreedisciplineภาควิชาวิทยาการคอมพิวเตอร์th
dc.description.degreelevel-en
dc.description.degreelevel-th
dc.description.degreenameMASTER OF SCIENCE (M.Sc.)en
dc.description.degreenameวิทยาศาสตรมหาบัณฑิต (วท.ม.)th
dc.identifier.urihttp://ir-ithesis.swu.ac.th/dspace/handle/123456789/2767
dc.language.isoth
dc.publisherSrinakharinwirot University
dc.rightsSrinakharinwirot University
dc.subjectคะแนนการจดจำภาพth
dc.subjectโครงข่ายสังวัฒนาการth
dc.subjectโครงข่ายทรานสฟอรมเมอร์th
dc.subjectImage memorabilityen
dc.subjectConvolutional Neural Networken
dc.subjectTransformeren
dc.subject.classificationComputer Scienceen
dc.subject.classificationComputer Scienceen
dc.subject.classificationProfessional, scientific and technical activitiesen
dc.subject.classificationComputer scienceen
dc.titleIMAGE MEMORABILITY PREDICTION USING DEEP LEARNINGen
dc.titleการทำนายการจดจำภาพด้วยการเรียนรู้เชิงลึกth
dc.typeMaster’s Projecten
dc.typeสารนิพนธ์th

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
gs651160199.pdf
Size:
3.08 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
160 B
Format:
Plain Text
Description: