การวัดแบบอิงกลุ่มและการวัดแบบอิงเกณฑ์ : ทฤษฎีและแนวปฏิบัติ
Main Article Content
บทคัดย่อ
แบบทดสอบอิงกลุ่มและแบบทดสอบอิงเกณฑ์เป็นแบบทดสอบวัดผลสัมฤทธิ์หรือสมรรถนะทางการเรียนที่ใช้อยู่ทั่วไปขณะนี้แบบทดสอบแต่ละประเภทมีพื้นฐานทางทฤษฎีที่แตกต่างกัน การสร้างโดยประยุกต์ใช้ทฤษฎีไม่ถูกต้องจะทำให้เกิดการแปลความหมายของคะแนนที่ผิดพลาด นำไปสู่การตัดสินใจดำเนินการต่อเนื่องที่ผิด เกิดผลเสียต่อผู้เรียนและผู้มีส่วนได้เสียเป็นอย่างมาก การวัดแบบอิงกลุ่มและอิงเกณฑ์เป็นแนวคิดที่พัฒนาต่อเนื่องมาเป็นเวลาไม่ต่ำกว่าครึ่งศตวรรษ ในบทความนี้จะเรียกแนวคิดทั้งสองว่า “ทฤษฎี”
ทฤษฎีการวัดแบบอิงกลุ่มอธิบายว่า ในการวัดผลทั่วไปนั้นกรอบสาระหลักมีขนาดใหญ่มาก ไม่เป็นเนื้อเดียวกัน การวัดกรอบเนื้อหาข้างต้นใช้วิธีสุ่มตัวอย่างเนื้อหามาเพียงบางส่วนมาสร้างเป็นแบบทดสอบ ไม่ได้นำเนื้อหาทั้งหมดมาสร้างเป็นแบบทดสอบ คะแนนที่ได้จากแบบทดสอบจึงไม่ใช่คะแนนจริง และไม่เสมือนจริง ไม่สามารถแปลความหมายของคะแนนโดยคิดเป็นร้อยละได้ ต้องแปลความหมายอิงกลุ่มผู้สอบที่เข้าสอบ ในขณะที่ทฤษฎีการวัดแบบอิงเกณฑ์อธิบายว่าในบางกรณีการวัดผลนั้นกลุ่มสาระหลักมีขนาดเล็กและเป็นเนื้อเดียวกันสุ่มเนื้อหามาสอบเพียงนิดเดียวก็สามารถแทนเนื้อหาทั้งหมดได้ เหมือนสุ่มแกงเพียงหนึ่งช้อนจากแกงหนึ่งหม้อ สามารถใช้แกงหนึ่งช้อนประเมินแกงหนึ่งหม้อได้ในทำนองเดียวกันในการวัดแบบอิงเกณฑ์จะถือว่าคะแนนจากแบบทดสอบเป็นคะแนนเสมือนจริงเป็นตัวประมาณค่าคะแนนจริงที่เชื่อถือได้ ดังนั้นจึงสามารถแปลความหมายคะแนนโดยคิดเป็นร้อยละ แล้วเทียบหรืออิงกับเกณฑ์ ซึ่งเป็นกลุ่มสาระหลักว่าผู้สอบมีความรู้ความสามารถคิดเป็นร้อยละของความรู้ทั้งหมดเท่าไรได้
Article Details
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
1. บทความที่ลงตีพิมพ์ทุกเรื่องได้รับการตรวจทางวิชาการโดยผู้ประเมินอิสระ ผู้ทรงคุณวุฒิ (Peer Review) สาขาที่เกี่ยวข้อง อย่างน้อย 3 ท่าน ในรูปแบบ Double blind review
2. ข้อคิดเห็นใด ๆ ของบทความที่ลงตีพิมพ์ในวารสารมหาวิทยาลัยราชภัฏมหาสารคาม นี้เป็นของผู้เขียน คณะผู้จัดทำวารสารไม่จำเป็นต้องเห็นด้วย
3. กองบรรณาธิการวารสารมหาวิทยาลัยราชภัฏมหาสารคาม ไม่สงวนสิทธิ์การคัดลอกแต่ให้อ้างอิงแสดงที่มา
References
Brennan, R. L., & Kane, M. T. (1977). An index of dependability for mastery tests. Journal of Educational Measurement, 14, 277-289.
Brennan, R. L. (1983). Elements of Generalizability Theory. Iowa: ACT Publications.
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 292-334.
Ebel, R. L. (1970). Essentials of Educational Measurement. New Jersey: Prentice-Hall.
Hambleton, R. K., Swaminathan, H., Algina, J., & Coulson, D. B. (1978). Criterion-referenced testing and measurement: A review of technical issues and developments. Review of Educational Research, 48(1), 1-47.
IELTS Liz. (2024.). IELTS band score. https://ieltsliz-band-scores/
Glaser, R. (1963). Instructional technology, and the measurement of learning outcomes, Some questions, American Psychologist, 18, 519-521
KAPOOK. (n.d.). สอบใบขับขี่รถยนต์.https://car.kapook.com/view173898.html.Lyman, H. B. (1978). Test scores and what they mean (3rd Ed.). Englewood Cliffs.NJ: Prentice Hall.
Net News. (2559). ใบรายงานผลโอเน็ตมีกี่แบบ.https://www.niets.or.th
PISA Technical Report. (2022). Proficiency Scale Construction for the Core Domains. https://www.oecd.org/pisa/data/pisa2022technicalreport/.
Popham, W. J. (1981). Modern Educational Measurement. Englewood Cliffs. NJ: Prentice Hall.
Popham, W. J. (2014). Criterion-Referenced Measurement: Half a Century Wasted. https://www.ascd.org/el/ articles/criterion-referenced-measurement-half-century-waste.
Spearman, C. (1904). The proof and measurement of association between two things. American Journal of Psychology, 15, 72-101.