การเลือกลักษณะสำาหรับการแทนค่าข้อมูลสูญหายในการวัดประสิทธิภาพการผลิต ปลานิลในจังหวัดสุพรรณบุร
Main Article Content
บทคัดย่อ
การวิจัยนี้มีวัตถุประสงค์เพื่อ 1) พัฒนาวิธีการแทนค่าข้อมูลสูญหายแบบใหม่ (FSNNR) โดยการรวมวิธีการเลือก
ลักษณะ (Feature selection) กับการแทนค่าข้อมูลสูญหายด้วยวิธี Nearest Neighbor Regression Imputation
2) เปรียบเทียบประสิทธิภาพของวิธีการแทนค่าข้อมูลสูญหายแบบใหม่กับวิธีการแทนค่าข้อมูลสูญหายแบบเดิม 3 วิธี
(RI, KNN และ NNR) ภายใต้ 36 สถานการณ์ จาก 3 เงื่อนไข ได้แก่ ขนาดตัวอย่าง ร้อยละของการสูญหายของข้อมูล
และขนาดของส่วนเบี่ยงเบนมาตรฐานของความคลาดเคลื่อนของข้อมูล โดยใช้การจำลองสถานการณ์ด้วยวิธีมอนติคาร์โล
ทดลองซ้ำเป็นจำนวน 1,000 ครั้ง ในแต่ละสถานการณ์ และ 3) เพื่อนำวิธีการแทนค่าข้อมูลสูญหายที่พัฒนาขึ้นไปใช้
แทนค่าในแบบจำลองการวัดประสิทธิภาพการผลิตปลานิลของจังหวัดสุพรรณบุรี ผลการศึกษาปรากฏว่า
1) วิธีการแทนค่าข้อมูลสูญหายแบบใหม่ (FSNNR) มีขั้นตอนดังนี้
ขั้นตอนที่ 1 เลือกลักษณะของข้อมูล 2 ลักษณะ ด้วยวิธี Nearest Neighbor โดยใช้สูตร Euclidean distance
ขั้นตอนที่ 2 แทนค่าข้อมูลสูญหายด้วยวิธี K-Nearest Neighbor Imputation โดยกำหนดค่า k = 2 และขั้นตอนที่
3 นำข้อมูลสมบูรณ์ที่ได้จากขั้นตอนที่ 2 มาแทนค่าข้อมูลสูญหายด้วยวิธี Regression Imputation
2) ประสิทธิภาพของการแทนค่าข้อมูลสูญหายแบบใหม่ ดีกว่าการแทนค่าข้อมูลสูญหายแบบเดิม จำนวน 33
สถานการณ์
3) ประสิทธิภาพทางเทคนิคของการผลิตปลานิลของเกษตรกรแต่ละราย เมื่อแทนค่าข้อมูลสูญหายด้วยวิธี FSNNR
ปรากฏว่า ส่วนใหญ่ของเกษตรกรผู้เลี้ยงปลานิลเป็นกลุ่มที่มีค่าประสิทธิภาพทางเทคนิคระดับมากที่สุด ร้อยละ 82.76
และมีค่าประสิทธิภาพทางเทคนิคระดับมาก ร้อยละ 24.14
Article Details
เอกสารอ้างอิง
และสหกรณ์.
Aigner, D., Lovell, C. A. K., & Schmidt, P. (1977). Formulation and estimation of stochastic frontier production
function models. Journal of Econometrics, 6(1), 21–37. https://doi.org/10.1016/0304-4076(77)90052-5
Alam, M. F., Khan, M. A., & Huq, A. A. Anwarul. (2012). Technical efficiency in Tilapia farming of Bangladesh:
a stochastic frontier production approach. Aquaculture International, 20(4), 619–634. https://
doi.org/10.1007/s10499-011-9491-3
Alawode, O. O., & Jinad, A. O. (2014). Evaluation of technical efficiency of catfish produ ction in oyo
state: a case study of Ibadan Metropolis. Journal of Emerging Trends in Educational Research and
Policy Studies, 5(2), 223–231.
Beretta, L., & Santaniello, A. (2016). Nearest neighbor imputation algorithms: a critical evaluation. BMC
Medical Informatics and Decision Making, 16(S3), 198-208.
Chaimongkol, W., & Suwattee, P. (2004). Nearest Neighbor- Regression Imputation (Vol. 5). Presented at the
Applied Statistics Conference 2004, Chaingmai: Chaingmai University.
Eskelson, B. N. I., Temesgen, H., Lemay, V., Barrett, T. M., Crookston, N. L., & Hudak, A. T. (2009).
The roles of nearest neighbor methods in imputing missing data in forest inventory and
monitoring databases. Scandinavian Journal of Forest Research, 24(3), 235–246. https://doi.
org/10.1080/02827580902870490
Farrell, M. J. (1957). The measurement of productive efficiency. Journal of the Royal Statistical Society.
Series A (General), 120(3), 253-290. https://doi.org/10.2307/2343100
Kumari, B., & Swarnkar, T. (2011). Filter versus wrapper feature subset selection in large dimensionality
microarray : A Review. International Journal of Computer Science and Information Technologies.
2(3), 1048–1053.
Ibrahim, J. G., & Molenberghs, G. (2009). Missing data methods in longitudinal studies: a review. TEST,
18(1), 1–43. https://doi.org/10.1007/s11749-009-0138-x
Islam, G. M. N., Tai, S. Y., & Kusairi, M. N. (2016). A stochastic frontier analysis of technical efficiency of
fish cage culture in Peninsular Malaysia. SpringerPlus, 5(1), 1–11. https://doi.org/10.1186/s40064-016-2775-3
Ladha, L., & Deepa, T. (2011). Feature selection methods and algorithms. International Journal on Computer
Science and Engineering (IJCSE), 3(5), 1787–1797.
Li, S., Harner, E. J., & Adjeroh, D. A. (2011). Random KNN feature selection - a fast and stable alternative to
Random Forests. BMC Bioinformatics, 12(450), 1-11. https://doi.org/10.1186/1471-2105-12-450, 1–11.
Raymond, M. R. (2016). Missing data in evaluation research. Evaluation & the Health Professions,
4(9), 395-420. doi:10.1177/016327878600900401
Shweta, S., Nikita, J., & Madhvi, G. (2013). A Review paper on feature selection methodologies and their
applications. International Journal of Engineering Research and Development, 7(6), 57–61.
Troyanskaya, O., Cantor, M., Sherlock, G., Brown, P., Hastie, T., Tibshirani, R., & Altman, R. B. (2001). Missing
value estimation methods for DNA microarrays. Bioinformatics (Oxford, England), 17(6), 520–525.