Please use this identifier to cite or link to this item:
http://ir-ithesis.swu.ac.th/dspace/handle/123456789/1699
Title: | VENOUS THROMBOEMBOLISM DIAGNOSIS BASED ON MACHINE LEARNING การวินิจฉัยภาวะลิ่มเลือดอุดตันในหลอดเลือดดำด้วยหลักการเรียนรู้ของเครื่อง |
Authors: | PAKAPOL ANUPOOMCHAIYA ภคพล อนุภูมิชัยยา Vera Sa-ing วีระ สอิ้ง Srinakharinwirot University Vera Sa-ing วีระ สอิ้ง vera@swu.ac.th vera@swu.ac.th |
Keywords: | ภาวะลิ่มเลือดอุดตันในหลอดเลือดดำ ปัญหาความไม่สมดุลของข้อมูล หลักการเรียนรู้ของเครื่อง วิธีการแก้ปัญหาความไม่สมดุลของข้อมูล VENOUS THROMBOEMBOLISM MACHINE LEARNING IMBALANCED DATA RESAMPLING DATA METHOD |
Issue Date: | 8 |
Publisher: | Srinakharinwirot University |
Abstract: | Thrombosis is the main cause of blood clots that obstruct the flow of blood in an artery or venous thrombosis. Thus, venous thromboembolism (VTE) is the most serious cause of cardiovascular disease. Furthermore, this disease is a leading cause of death in Thailand because of a lack of caution and understanding. In this research, an automatic diagnosis model was proposed by using effective machine learning to predict the important risk factors for VTE. The raw data were collected from the medical ward at King Chulalongkorn Memorial Hospital, Thailand. Before the analysis, this data consisted of 1,290 rows and 65 columns that were analyzed, solved, and transformed into prepared data. By resampling algorithms to import into each model, this research splits the prepared data into the training dataset and the testing dataset with a ratio of 75:25, 70:30, and 67:33. In these experiments, this research compared the effectiveness of the three machine learning models, consisting of Adaptive Boosting (AdaBoost), Random Forest (RF), and Extreme Gradient Boosting (XGBoost) to find the best diagnostic model. According to the experimental results, the Random Forest model was computed by the class weight and oversampled by the sampling strategy with 0.50 technique is the most efficient model to represent the prediction accuracy of 99.61%. Therefore, the Random Forest and the proposed setting will assist medical doctors in determining the risk of symptomatic venous thromboembolism. In addition, the proposed model can be used to forecast the likelihood of VTE based on a combination of the important risk factors. การเกิดลิ่มเลือดอุดตันเป็นสาเหตุหลักของลิ่มเลือดที่ขัดขวางการไหลเวียนของเลือดทั้งในหลอดเลือดแดงหรือหลอดเลือดดำ ดังนั้นการเกิดลิ่มเลือดอุดตันในหลอดเลือดดำ (Venous Thromboembolism - VTE) จึงเป็นสาเหตุที่ร้ายแรงที่สุดของโรคหัวใจและหลอดเลือด นอกจากนี้โรคนี้ยังเป็นสาเหตุการเสียชีวิตอันดับต้นๆ ในประเทศไทย เนื่องจากขาดความระมัดระวังและความเข้าใจ ในงานวิจัยนี้ขอเสนอแบบจำลองการวินิจฉัยภาวะลิ่มเลือดอุดตันในหลอดเลือดดำด้วยหลักการเรียนรู้ของเครื่องที่มีประสิทธิภาพในการทำนายปัจจัยเสี่ยงที่สำคัญสำหรับ VTE เก็บข้อมูลจากหอผู้ป่วยที่โรงพยาบาลจุฬาลงกรณ์ ประเทศไทย ข้อมูลประกอบด้วย 1,290 แถวและ 65 คอลัมน์ งานวิจัยนี้จะแยกข้อมูลที่เตรียมไว้ออกเป็นชุดข้อมูลการฝึกอบรมและชุดข้อมูลการทดสอบด้วยอัตราส่วน 75:25, 70:30 และ 67:33 และเปรียบเทียบประสิทธิภาพของแบบจำลองทั้งสามแบบ ประกอบด้วย Adaptive Boosting (AdaBoost), Random Forest (RF) และ Extreme Gradient Boosting (XGBoost) เพื่อหาแบบจำลองที่ดีที่สุด จากผลการทดลอง แบบจำลอง Random Forest โดยใช้พารามิเตอร์ Class Weight แบบคำนวณ ใช้วิธีการแก้ปัญหาความไม่สมดุลของข้อมูลด้วยวิธี Oversampling กับพารามิเตอร์ sampling_strategy เท่ากับ 0.50 เป็นแบบจำลองที่มีประสิทธิภาพที่ดีที่สุด โดยความแม่นยำในการทำนายอยู่ที่ 99.61% ดังนั้น Random Forest จะเป็นวิธีที่จะช่วยให้แพทย์พิจารณาความเสี่ยงของการเกิดลิ่มเลือดอุดตันหลอดเลือดดำ นอกจากนี้ยังสามารถใช้เพื่อคาดการณ์การเกิด VTE โดยพิจารณาจากปัจจัยเสี่ยงที่สำคัญร่วมกัน |
URI: | http://ir-ithesis.swu.ac.th/dspace/handle/123456789/1699 |
Appears in Collections: | Faculty of Science |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
gs631130115.pdf | 16.7 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.