การเปรียบเทียบประสิทธิภาพการพยากรณ์ของตัวแบบการวิเคราะห์การถดถอยแบบพหุเมื่อข้อมูลมีระดับการกระจายต่างกัน

ผู้แต่ง

  • กนิษฐา ยิ้มนาค ภาควิชาคณิตศาสตร์และสถิติ คณะศิลปศาสตร์และวิทยาศาสตร์ มหาวิทยาลัยธุรกิจบัณฑิตย์

คำสำคัญ:

สัมประสิทธิ์การแปรผัน, วิธีตัดปลายกำลังสองน้อยที่สุด, วิธีโครงข่ายประสาทเทียม

บทคัดย่อ

การศึกษาครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของตัวแบบการวิเคราะห์การถดถอยแบบพหุระหว่างวิธีตัดปลายกำลังสองน้อยที่สุด (Least Trimmed Square ; LTS) และวิธีโครงข่ายประสาทเทียม (Artificial Neural Networks ;ANN) เมื่อข้อมูลมีค่านอกกลุ่ม (Outliers) ซึ่งทำให้เกิดการกระจายใน 3 ระดับ โดยแบ่งพิจารณาจากค่าสัมประสิทธิ์การแปรผัน (Coefficient of Variation, C.V.) ได้แก่ ระดับค่อนข้างต่ำ (C.V.< 5%) ระดับไม่สูงและไม่ต่ำ (5% C.V. 15%) และระดับค่อนข้างสูง (C.V.>15%) โดยใช้ข้อมูลราคายางพาราในประเทศไทยปี 2005 ข้อมูลระดับความเค็มของน้ำทะเลบริเวณช่องแคบ North Carolina’s Pamlico ปี 1980 และข้อมูลปริมาณการใช้ออกซิเจนของตัวอ่อนแมลงเต่าทองปี 1961 เป็นตัวแทนของการกระจายทั้ง 3 ระดับ ตามลำดับ ผลการศึกษา พบว่า ตัวแบบจากวิธี ANN ให้ประสิทธิภาพในการพยากรณ์สำหรับการวิเคราะห์การถดถอยแบบพหุสูงกว่าตัวแบบที่ได้จากวิธี LTS โดยวัดจากค่าความคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) ข้อมูลราคายางพาราในประเทศไทย ซึ่งเป็นข้อมูลที่มีการกระจายค่อนข้างต่ำ (C.V.= 2.11%) และข้อมูลปริมาณการใช้ออกซิเจนของตัวอ่อนแมลงเต่าทอง ซึ่งจัดเป็นข้อมูลที่มีการกระจายค่อนข้างสูง (C.V. = 19.01%) พบว่าวิธี LTS ให้ค่า MSE สูงกว่า วิธี ANN เพียง 1.353 เท่า และ 1.563 เท่าตามลำดับ ส่วนข้อมูลระดับความเค็มของน้ำทะเลบริเวณช่องแคบ North Carolina’s Pamlico ซึ่งมีกระจายไม่สูงและไม่ต่ำ (C.V.= 7.56%) พบว่าตัวแบบจากวิธี LTS ให้ค่า MSE สูงกว่า วิธี ANN ถึง 6 เท่า ดังนั้นการศึกษาครั้งนี้สรุปได้ว่า กรณีที่ข้อมูลมีการกระจายค่อนข้างต่ำ และข้อมูลที่มีการกระจายค่อนข้างสูง ตัวแบบที่ได้จากการพยากรณ์ด้วยวิธี ANN และ วิธี LTS มีประสิทธิ์ภาพไม่ต่างกันมาก ส่วนข้อมูลปริมาณการใช้ออกซิเจนของตัวอ่อนแมลงเต่าทองซึ่งมีกระจายไม่สูงและไม่ต่ำ วิธี LTS ให้ค่า MSE สูงกว่า วิธี ANN ค่อนข้างมาก แสดงว่า ในการศึกษาครั้งนี้ในกรณีที่ข้อมูลมีการกระจายไม่สูง และไม่ต่ำ วิธี ANN มีประสิทธิภาพดีกว่าวิธี LTS

References

กัญญารัตน์ โพธิสุทธิ์. (2547). การประมาณค่าพารามิเตอร์ในตัวแบบการถดถอยเชิงเส้นเมื่อมีค่าผิดปกติในตัวแปรตาม. วิทยานิพนธ์ปริญญามหาบัณฑิต ภาควิชาสถิติ บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.

ประกายรัตน์ สุวรรณ. (2539). การเปรียบเทียบการพยากรณ์อนุกรมเวลาที่มีฤดูกาลโดยวิธีนิวรอลเน็ทเวิร์คแบบแบ็คพรอพะเกชันกับวิธีบอกซ์และเจนกินส์. รายงานการศึกษาอิสระ ปริญญาวิทยาศาสตรมหาบัณฑิต สาขาสถิติประยุกต์ มหาวิทยาลัยธรรมศาสตร์.

เพ็ญพรรณ ใช้ฮวดเจริญ. (2541). การจดจำอักษรพิมพ์ภาษาไทยโดยโครงข่ายประสาทเทียมแบบจำลองแดป อะทีฟโซแนนซ์เทียรี่. วิทยานิพนธ์ วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาการคอมพิวเตอร์และ เทคโนโลยีสารสนเทศ บัณฑิตวิทยาลัย สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง.

ศุภัทรา สุนทราภัย. (2539). การพัฒนาเครื่องมือซอฟแวร์ในการจำลองการทำงานของนิวรอลเน็ตเวิร์ค. วิทยานิพนธ์วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.

Bruce, D. and F. X. Schumacher(1935). Forest Mensuration. New York : McGraw-Hill.

Delurgio, S.A. (1998). Forecasting Principles and Applications. Singapore : Mc Graw-Hill companies.

Office of the Rubber Replanting Aid fund. (2005). Thailand Rubber Price. (Online). Available at http://rubber.co.th/rubber_price/rubberprice_mon_yr.php.

Rousseeuw, P.J. and Leroy, A.M. (1987). Robust Regression and Outlier Detection. New York : John Wiley Sons Inc.

Ruppert, D.and Carroll, R.J. (1980). Trimmed Least Squares Estimation in the Linear Model. Journal of the American Statistical Association. 75 (December) : 828 – 838

Yoshida, M. (1961). Ecological and Physiological Researches on the Wireworm , Melanotus caudex Lewis Iwata. Shizuoka Pref., Japan.

Downloads

เผยแพร่แล้ว

2020-08-18