การดำเนินการกับข้อมูลขาดหาย

Main Article Content

วุฒิ สุขเจริญ

Abstract

การวิจัยเกือบทุกประเภทมีโอกาสเกิดข้อมูลขาดหาย ซึ่งเกิดจากสาเหตุหลากหลาย ปัญหาของข้อมูลขาดหายทำให้การวิเคราะห์ข้อมูลขาดประสิทธิภาพและมีความยุ่งยากในการวิเคราะห์ข้อมูล เนื่องจากข้อมูลมีความลำเอียงจากข้อมูลที่ขาดหาย จึงได้พัฒนาวิธีต่าง ๆ เพื่อพยายามทดแทนข้อมูลขาดหาย การดำเนินการกับข้อมูลที่ขาดหายโดยใช้วิธี listwise deletion, pairwise deletion และการแทนค่าด้วยค่าเฉลี่ยเลขคณิตหรือค่าฐานนิยม เป็นวิธีที่มีความถูกต้องต่ำผู้เขียนแนะนำให้ใช้การดำเนินการกับข้อมูลขาดหายโดยใช้วิธีที่มีความถูกต้องสูง เช่น full information maximum-likelihood, expectation-maximization algorithm และ multiple Imputation

 

Dealing with Missing Data

In almost all research, there is the potential for missing data. Missing data can occur for various reasons. Problems associated with missing values are loss of efficiency, complications in handling and analyzing the data, and bias resulting from differences between missing data and complete data. A variety of methods have been developed to attempt to compensate for missing data. The author suggests that listwise deletion, pairwise deletion and mean/mode substitution are poor methods for handling missing data, whereas full information maximumlikelihood, expectation-maximization algorithm, and multiple imputations are recommended alternatives to this approach.

Article Details

Section
Article