การเปรียบเทียบประสิทธิภาพการพยากรณ์ของตัวแบบการวิเคราะห์การถดถอยแบบพหุเมื่อข้อมูลมีระดับการกระจายต่างกัน
คำสำคัญ:
สัมประสิทธิ์การแปรผัน, วิธีตัดปลายกำลังสองน้อยที่สุด, วิธีโครงข่ายประสาทเทียมบทคัดย่อ
การศึกษาครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของตัวแบบการวิเคราะห์การถดถอยแบบพหุระหว่างวิธีตัดปลายกำลังสองน้อยที่สุด (Least Trimmed Square ; LTS) และวิธีโครงข่ายประสาทเทียม (Artificial Neural Networks ;ANN) เมื่อข้อมูลมีค่านอกกลุ่ม (Outliers) ซึ่งทำให้เกิดการกระจายใน 3 ระดับ โดยแบ่งพิจารณาจากค่าสัมประสิทธิ์การแปรผัน (Coefficient of Variation, C.V.) ได้แก่ ระดับค่อนข้างต่ำ (C.V.< 5%) ระดับไม่สูงและไม่ต่ำ (5% C.V. 15%) และระดับค่อนข้างสูง (C.V.>15%) โดยใช้ข้อมูลราคายางพาราในประเทศไทยปี 2005 ข้อมูลระดับความเค็มของน้ำทะเลบริเวณช่องแคบ North Carolina’s Pamlico ปี 1980 และข้อมูลปริมาณการใช้ออกซิเจนของตัวอ่อนแมลงเต่าทองปี 1961 เป็นตัวแทนของการกระจายทั้ง 3 ระดับ ตามลำดับ ผลการศึกษา พบว่า ตัวแบบจากวิธี ANN ให้ประสิทธิภาพในการพยากรณ์สำหรับการวิเคราะห์การถดถอยแบบพหุสูงกว่าตัวแบบที่ได้จากวิธี LTS โดยวัดจากค่าความคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) ข้อมูลราคายางพาราในประเทศไทย ซึ่งเป็นข้อมูลที่มีการกระจายค่อนข้างต่ำ (C.V.= 2.11%) และข้อมูลปริมาณการใช้ออกซิเจนของตัวอ่อนแมลงเต่าทอง ซึ่งจัดเป็นข้อมูลที่มีการกระจายค่อนข้างสูง (C.V. = 19.01%) พบว่าวิธี LTS ให้ค่า MSE สูงกว่า วิธี ANN เพียง 1.353 เท่า และ 1.563 เท่าตามลำดับ ส่วนข้อมูลระดับความเค็มของน้ำทะเลบริเวณช่องแคบ North Carolina’s Pamlico ซึ่งมีกระจายไม่สูงและไม่ต่ำ (C.V.= 7.56%) พบว่าตัวแบบจากวิธี LTS ให้ค่า MSE สูงกว่า วิธี ANN ถึง 6 เท่า ดังนั้นการศึกษาครั้งนี้สรุปได้ว่า กรณีที่ข้อมูลมีการกระจายค่อนข้างต่ำ และข้อมูลที่มีการกระจายค่อนข้างสูง ตัวแบบที่ได้จากการพยากรณ์ด้วยวิธี ANN และ วิธี LTS มีประสิทธิ์ภาพไม่ต่างกันมาก ส่วนข้อมูลปริมาณการใช้ออกซิเจนของตัวอ่อนแมลงเต่าทองซึ่งมีกระจายไม่สูงและไม่ต่ำ วิธี LTS ให้ค่า MSE สูงกว่า วิธี ANN ค่อนข้างมาก แสดงว่า ในการศึกษาครั้งนี้ในกรณีที่ข้อมูลมีการกระจายไม่สูง และไม่ต่ำ วิธี ANN มีประสิทธิภาพดีกว่าวิธี LTS
References
กัญญารัตน์ โพธิสุทธิ์. (2547). การประมาณค่าพารามิเตอร์ในตัวแบบการถดถอยเชิงเส้นเมื่อมีค่าผิดปกติในตัวแปรตาม. วิทยานิพนธ์ปริญญามหาบัณฑิต ภาควิชาสถิติ บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.
ประกายรัตน์ สุวรรณ. (2539). การเปรียบเทียบการพยากรณ์อนุกรมเวลาที่มีฤดูกาลโดยวิธีนิวรอลเน็ทเวิร์คแบบแบ็คพรอพะเกชันกับวิธีบอกซ์และเจนกินส์. รายงานการศึกษาอิสระ ปริญญาวิทยาศาสตรมหาบัณฑิต สาขาสถิติประยุกต์ มหาวิทยาลัยธรรมศาสตร์.
เพ็ญพรรณ ใช้ฮวดเจริญ. (2541). การจดจำอักษรพิมพ์ภาษาไทยโดยโครงข่ายประสาทเทียมแบบจำลองแดป อะทีฟโซแนนซ์เทียรี่. วิทยานิพนธ์ วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาการคอมพิวเตอร์และ เทคโนโลยีสารสนเทศ บัณฑิตวิทยาลัย สถาบันเทคโนโลยีพระจอมเกล้าเจ้าคุณทหารลาดกระบัง.
ศุภัทรา สุนทราภัย. (2539). การพัฒนาเครื่องมือซอฟแวร์ในการจำลองการทำงานของนิวรอลเน็ตเวิร์ค. วิทยานิพนธ์วิศวกรรมศาสตรมหาบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.
Bruce, D. and F. X. Schumacher(1935). Forest Mensuration. New York : McGraw-Hill.
Delurgio, S.A. (1998). Forecasting Principles and Applications. Singapore : Mc Graw-Hill companies.
Office of the Rubber Replanting Aid fund. (2005). Thailand Rubber Price. (Online). Available at http://rubber.co.th/rubber_price/rubberprice_mon_yr.php.
Rousseeuw, P.J. and Leroy, A.M. (1987). Robust Regression and Outlier Detection. New York : John Wiley Sons Inc.
Ruppert, D.and Carroll, R.J. (1980). Trimmed Least Squares Estimation in the Linear Model. Journal of the American Statistical Association. 75 (December) : 828 – 838
Yoshida, M. (1961). Ecological and Physiological Researches on the Wireworm , Melanotus caudex Lewis Iwata. Shizuoka Pref., Japan.
Downloads
เผยแพร่แล้ว
How to Cite
ฉบับ
บท
License
เนื้อหาและข้อมูลในบทความที่ลงตีพิมพ์ในวารสารสุทธิปริทัศน์ ถือเป็นข้อคิดเห็นและความรับผิดชอบของผู้เขียนบทความโดยตรงซึ่งกองบรรณาธิการวารสาร ไม่จำเป็นต้องเห็นด้วย หรือร่วมรับผิดชอบใดๆ
บทความ ข้อมูล เนื้อหา รูปภาพ ฯลฯ ที่ได้รับการตีพิมพ์ในวารสารสุทธิปริทัศน์ ถือเป็นลิขสิทธิ์ของวารสารสุทธิปริทัศน์หากบุคคลหรือหน่วยงานใดต้องการนำทั้งหมดหรือส่วนหนึ่งส่วนใดไปเผยแพร่ต่อหรือเพื่อกระทำการใด ๆ จะต้องได้รับอนุญาตเป็นลายลักษณ์อักษรจากวารสารสุทธิปริทัศน์ก่อนเท่านั้น