การสรุปอ้างอิงความน่าเชื่อถือของการประเมินความสอดคล้องในแนวเดียวกันระหว่างข้อสอบกับตัวชี้วัดวิทยาศาสตร์: การประยุกต์ใช้ทฤษฎีการสรุปอ้างอิง ความน่าเชื่อถือของผลการวัด
Main Article Content
บทคัดย่อ
งานวิจัยนี้มีวัตถุประสงค์เพื่อ 1) ศึกษาขนาดขององค์ประกอบความแปรปรวนของคะแนนการประเมินความสอดคล้องในแนวเดียวกันระหว่างข้อสอบกับตัวชี้วัดกลุ่มสาระการเรียนรู้วิทยาศาสตร์ ระดับชั้นมัธยมศึกษาตอนต้น 2) เปรียบเทียบค่าสัมประสิทธิ์การสรุปอ้างอิงของคะแนนการประเมินความสอดคล้องในแนวเดียวกันระหว่างข้อสอบกับตัวชี้วัดฯ เมื่อจำนวนผู้ประเมินและรูปแบบการออกแบบการประเมินต่างกัน และ 3) วิเคราะห์จำนวนผู้ประเมินที่ทำให้เกิดความน่าเชื่อถือของการประเมินความสอดคล้องในแนวเดียวกันระหว่างข้อสอบกับตัวชี้วัดฯ ในระดับที่ยอมรับได้ ตัวอย่างในการวิจัย ได้แก่ ข้อสอบในการประเมินระดับชั้นเรียน กลุ่มสาระการเรียนรู้วิทยาศาสตร์ ชั้นมัธยมศึกษาปีตอนต้น ของโรงเรียนมัธยมศึกษา สังกัดสำนักงานคณะกรรมการการศึกษาขั้นพื้นฐาน ในกรุงเทพมหานคร จำนวน 1,089 ข้อ และผู้เชี่ยวชาญในการประเมินความสอดคล้องฯ จำนวน 20 คน เครื่องมือที่ใช้ในการวิจัย คือ แบบประเมินความสอดคล้องใน แนวเดียวกัน จากการตรวจสอบความเที่ยงระหว่างผู้ประเมินด้วยสถิติแคปปาของฟลีส (Fleiss’ kappa statistic: Kf) มีค่าเท่ากับ 0.510 และสถิติสหสัมพันธ์ภายในชั้น (intra-class correlation: ICC) ที่ระดับความเชื่อมั่น 95% มีค่าเท่ากับ 0.954 วิเคราะห์และเปรียบเทียบค่าสัมประสิทธิ์การสรุปอ้างอิง (G-coefficient) ตามทฤษฎีการสรุปอ้างอิงความน่าเชื่อถือของผลการวัด เมื่อจำนวนผู้ประเมินและรูปแบบการออกแบบการประเมินต่างกัน ผลการวิจัยพบว่า 1) ค่าความแปรปรวนของคะแนนความสอดคล้องในแนวเดียวกันของข้อสอบมีค่าสูงสุด และความแปรปรวนอันเกิดจากผู้ประเมินมีค่าต่ำสุด ตามลำดับ 2) ค่าสัมประสิทธิ์การสรุปอ้างอิงมีค่าเพิ่มขึ้นเมื่อจำนวนผู้ประเมินเพิ่มขึ้น ในทุกรูปแบบการออกแบบการประเมิน ทั้งในส่วนของการประเมินระดับความซับซ้อนทางปัญญา และในส่วนของการประเมินระดับความสอดคล้องในแนวเดียวกันระหว่างข้อสอบกับตัวชี้วัด ด้วยมาตรประมาณค่า 5 ระดับ และ 3) การประเมินระดับความซับซ้อนทางปัญญาต้องการจำนวนผู้ประเมินมากกว่าการประเมินระดับความสอดคล้องในแนวเดียวกันระหว่างข้อสอบกับตัวชี้วัด ที่มีลักษณะเป็นมาตรประมาณค่า 5 ระดับ