ประสิทธิภาพของการทดสอบแบบปรับเหมาะด้วยคอมพิวเตอร์ โดยประยุกต์ใช้โมเดลการตอบสนองข้อสอบแบบพหุมิติ; The Efficiency of a Computerized Adaptive Testing (CAT) by Applying Multidimensional Item Response Models

Main Article Content

สุชาติ หอมจันทร์ Suchart Homjan

Abstract

บทคัดย่อ

                การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของการทดสอบแบบปรับเหมาะ ด้วยคอมพิวเตอร์แบบพหุมิติ ที่กำหนดตัวแปรขนาดคลังข้อสอบ (A) จำนวน 100 ข้อ (a1)  150 ข้อ (a2) และ 200 ข้อ (a3) และตัวแปรเกณฑ์ยุติการสอบ (B) 3 เกณฑ์ คือ จำนวน 20 ข้อ (b1) SE(q) £ .30(Reliability = .91)  (b2)  และ SE(q) £ .43 (Reliability = .81) (b3)  ข้อมูลที่ใช้เป็นการจำลองสถานการณ์ ด้วยโปรแกรม MATLAB โดยจำลองผู้สอบในแต่ละเงื่อนไข 1,000 คน วิเคราะห์ข้อมูลด้วยการวิเคราะห์ความแปรปรวนพหุคูณสองทาง (Two-way  MANOVA) และทดสอบภายหลังด้วย Holtelling T2  ผลการวิจัยพบว่ามีปฏิสัมพันธ์ (IAB) อย่างมีนัยสำคัญทางสถิติที่ระดับ .01 ระหว่างขนาดคลังข้อสอบ  กับเกณฑ์ยุติการสอบ  จึงทำการเปรียบเทียบรายคู่ (simple main effect) พบว่า

                1.  กรณีคลังข้อสอบ 100 ข้อ จะให้ความถูกต้องในการประมาณค่าความสามรถของผู้สอบได้ดีที่สุดเมื่อกำหนด SE(q) £ .30 (b2) แต่จะให้ความแม่นยำในการประมาณค่าความสามรถของผู้สอบได้ดีที่สุด เมื่อกำหนด SE(q) £ .43 (b3)  เป็นเกณฑ์ยุติการสอบ

                2.  กรณีคลังข้อสอบ 150 ข้อ จะให้ความแม่นยำ และความถูกต้องในการประมาณค่าความสามารถของผู้สอบ ได้ดีที่สุด  เมื่อกำหนดข้อสอบ 20 ข้อ(b1) เป็นเกณฑ์ยุติการสอบ

                3.  กรณีคลังข้อสอบ 200 ข้อ (a3) จะให้ความถูกต้องในการประมาณค่าความสามารถของผู้สอบได้ดีที่สุด  เมื่อกำหนดเกณฑ์ยุติการสอบ (B) SE(q) £ .30 (b2) แต่จะให้ความแม่นยำในการประมาณค่าความ
สามรถของผู้สอบได้ดีที่สุด เมื่อกำหนดข้อสอบ 20 ข้อ(b1) เป็นเกณฑ์ยุติการสอบ

 

Abstract

                The purpose of this research was to compare the efficiency of a Multidimensional Computerized Adaptive Testing (MCAT) by setting the variables for item pool (A) for 100 items (a1), for 150 items (a2), for 200 items (a3), and the variables of termination criteria (B) 3 criterion were 20 items (b1), SE (q) £ .30 (Reliability = .91)  (b2), and SE(q) £ .43 (Reliability = .81) (b3). The data for simulation used the program of MATLAB by adapting each condition for 1,000 examinees.  Data were Multiple analysis of variance (Two – way MANOVA) and Post Hoc Procedure by Holtelling T2. The research result found, the interaction (IAB) was different at the statistical significance level of 0.01 between the item pool and the termination criteria so in comparing for simple main effect, it was found that                1.  Case item pool 100 items: accuracy of the estimated ability of the examinees will be the best when setting the termination criteria for SE (q) £ .30 (b2) but to the precision of  the estimated ability of the examinees will be the best  when setting the termination criteria for  SE(q) £ .43 (b3).                2. Case item pool 150 items: accuracy and precision  of  the estimated ability of the examinees  will be the best  when setting the termination criteria for 20 items (b1).                3.  Case item pool 200 items: accuracy of the estimated ability of the examinees will be the best when setting the termination criteria for SE(q) £ .30 (b2) but the precision of the estimated ability of the examinees will be the best  when setting the termination criteria for  20 items (b1).


Article Details

Section
Dissertations
Author Biography

สุชาติ หอมจันทร์ Suchart Homjan, Mahasarakham University

Thailand Citation Index Centre