การเปรียบเทียบค่าสัมประสิทธิ์การสรุปอ้างอิงของคะแนนแบบทดสอบความเรียง วิชาภาษาไทย ชั้นประถมศึกษาปีที่ 3 ที่มีจำนวนผู้ตรวจ วิธีการตรวจและรูปแบบการตรวจต่างกัน : กรณีศึกษาสำนักงานเขตพื้นที่การศึกษาประถมศึกษากำแพงเพชร เขต 2
Main Article Content
บทคัดย่อ
การวิจัยในครั้งนี้มีวัตถุประสงค์เพื่อศึกษาขนาดขององค์ประกอบความแปรปรวนเปรียบเทียบค่าสัมประสิทธิ์ การสรุปอ้างอิงของคะแนน และเปรียบเทียบค่าความแปรปรวนของความคลาดเคลื่อนของคะแนนแบบทดสอบความเรียงวิชาภาษาไทย ชั้นประถมศึกษาปีที่ 3 ที่มีจำนวนผู้ตรวจ วิธีการตรวจและรูปแบบการตรวจต่างกัน กลุ่มตัวอย่างที่ใช้ในการวิจัยในครั้งนี้ คือ นักเรียนชั้นประถมศึกษาปีที่ 3 ปีการศึกษา 2563 ของโรงเรียนในสังกัดสำนักงานเขตพื้นที่การศึกษาประถมศึกษากำแพงเพชร เขต 2 จำนวน 182 โรงเรียน โดยการสุ่มโรงเรียน แบ่งตามขนาดของโรงเรียนทั้งหมด 3 ขนาด ซึ่งได้มาด้วยวิธีการสุ่มอย่างง่าย (Simple Random Sampling) ได้โรงเรียนทั้งหมด 7 โรงเรียน โดยกลุ่มตัวอย่างที่ใช้ในการวิจัยในครั้งนี้ คือนักเรียนจํานวน 60 คน เครื่องมือที่ใช้เป็นแบบทดสอบการเขียนความเรียงวิชาภาษาไทย จำนวน 6 ข้อ วิเคราะห์ข้อมูลโดยการหาค่าสัมประสิทธิ์ การสรุปอ้างอิง โดยใช้โปรแกรม GENOVA ผลการวิจัยสรุปได้ว่า 1. ค่าความแปรปรวนในทุกเงื่อนไขจำนวนผู้ตรวจ รูปแบบการตรวจ และวิธีการตรวจให้คะแนน ความแปรปรวนที่มีค่ามากที่สุดคือผู้สอบ รองลงมาคือ
ข้อสอบ และผู้ตรวจ 2. ค่าสัมประสิทธิ์การสรุปอ้างอิงของคะแนนที่มีจำนวนผู้ตรวจ วิธีการตรวจและรูปแบบการตรวจต่างกัน พบว่า 2.1) ค่าสัมประสิทธิ์การสรุปอ้างอิงที่มีจำนวนผู้ตรวจต่างกัน เมื่อรูปแบบการตรวจและวิธีการตรวจให้คะแนนเหมือนกัน มีค่าสัมประสิทธิ์การสรุปอ้างอิงแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01 ยกเว้นรูปแบบตรวจข้อสอบบางข้อของผู้สอบทุกคน 2.2) ค่าสัมประสิทธิ์การสรุปอ้างอิงที่มีวิธีการตรวจให้
คะแนนต่างกัน ที่มีจำนวนผู้ตรวจเท่ากัน รูปแบบการตรวจเหมือนกัน มีค่าสัมประสิทธิ์การสรุปอ้างอิงแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01 ยกเว้น รูปแบบการตรวจข้อสอบบางข้อของผู้สอบทุกคน 2.3) ค่าสัมประสิทธิ์การสรุปอ้างอิงที่มีรูปแบบการตรวจต่างกัน เมื่อมีจำนวนผู้ตรวจเท่ากันโดยวิธีการตรวจให้คะแนนแบบแยกองค์ประกอบ พบว่า มีค่าสัมประสิทธิ์ การสรุปอ้างอิงแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01 ยกเว้น จำนวนผู้ตรวจ 1 คน ส่วนวิธีการตรวจให้คะแนนแบบประเมินรวม มีค่าสัมประสิทธิ์การสรุปอ้างอิงแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01 ยกเว้น จำนวนผู้ตรวจ 3 คน 3. ค่าความแปรปรวนของ ความคลาดเคลื่อนของคะแนนข้อสอบที่มีจำนวนผู้ตรวจ และวิธีการตรวจให้คะแนนต่างกัน เมื่อเพิ่มจำนวนผู้ตรวจ ค่าความแปรปรวนของความคลาดเคลื่อนลดลง ทั้ง 2 วิธีการตรวจให้คะแนน ยกเว้น รูปแบบตรวจข้อสอบบางข้อของผู้สอบทุกคน
Article Details

อนุญาตภายใต้เงื่อนไข Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
บทความที่ได้รับการตีพิมพ์เป็นลิขสิทธิ์ของวารสาร สักทอง : วารสารมนุษยศาสตร์และสังคมศาสตร์ สถาบันวิจัยและพัฒนา มหาวิทยาลับราชภัฏกำแพงเพชร
ข้อคิดเห็นใดๆ ที่ปรากฎในวารสารเป็นวรรณกรรมของผู้เขียนโดยเฉพาะ ซึ่งมหาวิทยาลัยราชภัฏกำแพงเพชรและบรรณาธิการไม่จำเป็นต้องเห็นด้วย
เอกสารอ้างอิง
Baikularb, A. (2007). An Investigation of Rater Agreement Indexes for Categorized Data. Doctor of Education Degree Srinakharinwirot University, Graduate School, Testing and Measurement.
Brennan, R.L., Gao, X. & Colton, D.A. (1995, April). Generalizability Analysis Work Key Listening and Writing Testing. Educational and Psychological Measurement, 55(2), 157-176.
Grounlund, Norman E. (1976). Measurement and Evaluation in Teaching. (3 rd ed.). New York : Macmillan.
Intanate, N. (2011). Characteristics of the Open-Ended Mathematics Test Scores for Different Numbers of Raters and Scoring Patterns Using Generalizability Model and Many-Facet Rasch Model. Doctor of Education Degree in Testing and Measurement Graduate School, Srinakharinwirot University.
Kanjanawasee, S. (2007). Modern Test Theories. Bangkok : Chulalongkorn University Press.
Kwanja, N. (2013). The Comparison of Generalizability Coefficient of Science Process Skill Test Mathayomsuksa 4 with Different Scoring Pattern. Master of Education Degree, Mahasarakharm University, Faculty of Education, Educational Measurement.
Linacre, John M. & Wright, Benjamin D. (2002). Construction of Measures from Manyfacet Data. Journal of Applied Measurement, 3(4), 486-512.
Ministry of Education. (2001). Basic Education Curriculum 2001. Bangkok : Kurusapa Ladprao Publishing.
Office of the Basic Education Commission, Bureau of Educational Testing. (2019). Student Quality Evaluation Manual of Phatumsuksa 3 Students Academic Year 2019. [Online]. Available : https://bet.obec.go.th./New2020 [2020, March 20].
Peeartit, P. (2002). A study of the optimal number of raters and number of writing tasks using different scoring rubrics. Master of Education Thesis Measurement and Evaluation in Education Graduate School Chulalongkorn University.
Smith, P.L. (1978). Sampling errors of variance components in small sample muitifaceted generalizability studies. Journal of Educational-Statistics, 3(4), 319-346.
Sriwaleerat, W. (2015). A Generalization Coefficient Comparison of Thai Essay Test for Phatumsuksa 6 Students between different Number of Items and Number of Raters. Master of Education Thesis Educational Research and Evaluation, Kanchanaburi Rajabhat University.
Sudweeks, R.R., Reeve, S. & Bradshaw, W.S. (2005). A Comparison of Generalizability Theory and Many-Facet Rash Measurement in an Analysis of College Sophomore Writing. Assessment Writing, 9(3), 239-261.
Swartz, C.W., Hooper, S.R., Montgomery, J.W., Wakely, M.B., De Kruif, R.E.L., Reed, M., Brown, T.T., Levine, M.D., & White, K.P. (1999, June). Using Generalizability Theory to Estimate the Reliability of Writing Scores Derived from Holistic and Analytical Scoring Methods. Education and Psychological Measurement, 59(3), 492-506.
Taoto, J. (2014). A Study of the Reliability of Mathematics Essay Test Score for Matayomsuksa 2 Students: The Different Number of Raters and Scoring Patterns Using Generalizability Theory. Master of Education Thesis Educational Research and Evaluation Pibulsongkram Rajabhat University.
Woodruff, D.J. & Feldt, L.S. (1986, September). Test for Equality of Several Alpha Coefficients When Their Sample Estimates are Dependent. Psychometrika, 51(2), 393-413.