โครงข่ายประสาทเทียมแบบแพร่ย้อนกลับร่วมกับอัตราการเรียนรู้แบบปรับตัวเองสำหรับการจำแนกประเภทข้อมูลที่ไม่สมดุลกัน

ผู้แต่ง

  • รุจิรา จุลภักดิ์ คณะบริหารธุรกิจและเทคโนโลยีสารสนเทศ มหาวิทยาลัยเทคโนโลยีราชมงคลตะวันออก
  • อาริต ธรรมโน คณะเทคโนโลยีสารสนเทศ สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง

คำสำคัญ:

การจำแนกประเภทข้อมูล, โครงข่ายประสาทเทียม, อ้ตราการเรียนรู้แบบปรับตัวเอง, อัลกอริทึมการเรียนรู้แบบแพร่ย้อนกลับ, ข้อมูลที่ไม่สมดุลกัน

บทคัดย่อ

ปัจจุบันมีงานวิจัยจำนวนมากที่ใช้การจำแนกประเภทข้อมูลด้วยวิธีการโครงข่ายประสาทเทียมแบบแพร่ย้อนกลับ เนื่องจากมีความสามารถที่จะเรียนรู้ข้อมูลที่ซับซ้อนได้เป็นอย่างดี แต่ปัญหาที่พบสำหรับวิธีการนี้คือ หากชุดข้อมูลที่นำมาใช้ในการเรียนรู้มีความไม่สมดุลกันของข้อมูล (Imbalanced data) โครงข่ายประสาทเทียมแบบแพร่ย้อนกลับจะเรียนรู้คลาสที่มีปริมาณข้อมูลมาก มากกว่าคลาสที่มีปริมาณข้อมูลน้อย ส่งผลให้การจำแนกประเภทนั้นเอนเอียงไปยังคลาสที่มีปริมาณข้อมูลมากกว่า ผลของการจำแนกประเภทโดยรวมจึงไม่ถูกต้อง งานวิจัยนี้มีวัตถุประสงค์เพื่อแก้ปัญหาความไม่สมดุลกันของปริมาณข้อมูลในแต่ละคลาส โดยได้นำเสนอวิธีโครงข่ายประสาทเทียมแบบแพร่ย้อนกลับร่วมกับอัตราการเรียนรู้แบบปรับตัวเอง (Backpropagation Neural Network with Adaptive Learning: BPNN-ALR) ซึ่งเป็นการปรับปรุงวิธีการเรียนรู้จากโครงข่ายประสาทเทียมแบบแพร่ย้อนกลับ ในการทดสอบประสิทธิภาพของวิธีการที่นำเสนอนั้น ผู้วิจัยได้ทดสอบกับชุดข้อมูลทางการแพทย์ที่มีความไม่สมดุลกันของข้อมูลจำนวน 2 ชุด ผลการทดสอบพบว่า สำหรับชุดข้อมูล Breast Tissue ความแม่นยำของวิธีการโครงข่ายประสาทเทียมแบบแพร่ย้อนกลับแบบดั้งเดิมถูกต้องร้อยละ 47.62 ส่วนวิธี BPNN-ALR ถูกต้องร้อยละ 77.14 สำหรับชุดข้อมูล Vertebral Column วิธีการโครงข่ายประสาทเทียมแบบแพร่ย้อนกลับแบบดั้งเดิมถูกต้องร้อยละ 48.39 ส่วนวิธี BPNN-ALR ถูกต้องร้อยละ 60.97 จากผลการทดลองที่ได้ทดสอบไปในเบื้องต้นพบว่าอัลกอริทึมที่พัฒนาขึ้นมามีความแม่นยำในการจำแนกประเภทมากกว่าวิธีการของโครงข่ายประสาทเทียมแบบแพร่ย้อนกลับแบบดั้งเดิม

References

นพมาศ อัครจันทโชติ, และดิเรก พนิตสุภากมล. (2562). การเปรียบเทียบวิธีการแก้ปัญหาข้อมูลไม่สมดุลสำหรับการจำแนกกลุ่มรายได้ของผู้ประกอบการร้านยาประเภท ข.ย. 1. In The 9th STOU National Research Conference. สืบค้นจาก http://sci-database.hcu.ac.th/science/file/rsID292_F1_20200122213859.pdf.

วิชญ์วิสิฐ เกษรสิทธิ์, จิราวัลย์ จิตรถเวช, และวิชิต หล่อจีระชุณห์กล. (2563). การลดจำนวนกลุ่มในการจำแนกแบบหลายกลุ่มเป็นสองกลุ่มสำหรับการจำแนกการกลับมารักษาซ้ำในโรงพยาบาลของผู้ป่วยโรคเบาหวาน. Thai Science and Technology Journal, 28(1), 41-51.

อาริกา ธรรมโน, มุทิตา หวังคิด, และอาริต ธรรมโน. (2563). การพยากรณ์โรคมะเร็งเต้านมด้วยอัลกอริทึมการจำแนกประเภทแบบเคมีร่วมกับค่าถ่วงน้ำหนักแบบปรับตัวเอง. Journal of Information Science and Technology, 10(2), 1-9.

Berthonnaud, E., Dimnet, J., Roussouly, P., & Labelle, H. (2005). Analysis of the sagittal balance of the spine and pelvis using shape and orientation parameters. Journal of Spinal Disorders & Techniques, 18(1), 40-47.

Blackard, J. A., & Dean, D. J. (1999). Comparative accuracies of artificial neural networks and discriminant analysis in predicting forest cover types from cartographic variables. Computers and Electronics in Agriculture, 24, 131-151.

Dreiseitl, S., & Ohno-Machado, L. (2002). Logistic regression and artificial neural network classification models: a methodology review. Journal of Biomedical Informatics, 35, 352–359.

Dua, D., & Graff, C. (2019). UCI machine learning repository. Retrieved from https://archive.ics.uci.edu/ml/index.php.

Feng, J., Xu, H., Mannor, S., & Yan, S. (2014). Robust logistic regression and classification. Proceedings of the 27th International Conference on Neural Information Processing Systems (NIPS 2014), Montreal, Quebec, Canada.

Geisser, S. (1975). The predictive sample reuse method with applications. Journal of the American Statistical Association, 70(350), 320-328.

Jia, W., Deng, Y., Xin, C., Liu, X., & Pedrycz, W. (2019). A classification algorithm with linear discriminant analysis and axiomatic fuzzy sets. Mathematical Foundations of Computing, 2(1), 73-81.

Jossinet, J. (1996). Variability of impedivity in normal and pathological breast tissue. Medical & Biological Engineering & Computing, 34, 346-350.

Rocha Neto, A. R., & Barreto, G. A. (2009). On the application of ensembles of classifiers to the diagnosis of pathologies of the vertebral column: A comparative analysis. IEEE Latin America Transactions, 7(4), 487-496.

Rocha Neto, A. R., Sousa, R., Barreto, G. A., & Cardoso, J. S. (2011). Diagnostic of pathology on the vertebral column with embedded reject option. In Proceedings of the 5th Iberian Conference on Pattern Recognition and Image Analysis (IbPRIA'2011), Gran Canaria, Spain, 588-595.

Silva, J. E., Marques de Sá, J. P., & Jossinet, J. (2000). Classification of breast tissue by electrical impedance spectroscopy. Medical & Biological Engineering & Computing, 38, 26-30.

Zhang, H., Huang, L., Wu, C. Q., & Li, Z. (2020). An effective convolutional neural network based on SMOTE and gaussian mixture model for intrusion detection in imbalanced dataset. Computer Networks, 177.

Downloads

เผยแพร่แล้ว

2021-06-29