试卷生成需要满足多重约束条件:①心理计量学约束条件,如难度、区分度,以及项目反应理论中的信息函数等。②测验格式约束条件,如测验题型分布、测验总题量、测验满分值,以及测验答题时间等。③测验内容约束条件,如章节覆盖面,掌握层次要求,所考核内容的教学地位(重点、次重点)等。④其他方面的约束条件,如一次生成的平行卷数,最多能允许的重测题或知识点数,乃至如何照顾少数民族等。
自动组卷
计算机按照一定准则,为形成测验(试卷)而从题库中自动选题的过程。
- 英文名称
- auto-generating test paper
- 所属学科
- 教育学
是最简单的组卷算法,按预先指定双向或多向细目表由计算机从题库中逐一检索试题。当检索不到所需试题时,可由计算机在类似试题中随机选题取代,从而体现一定的智能性。选题时,将制约目标的刚性约束条件和弹性约束条件区别对待,逐步放松要求,允许实际生成的试卷与目标要求有一定差距。选题过程逐题增加,当最后确实无法满足要求时,就要推倒重来,反复循环试误,以求得最优结果。
是对照目标测验信息曲线选择试题并生成试卷的。对测验精度或区分鉴别力的要求,可通过设计不同测验信息曲线的方法来解决。关于测验内容能力覆盖范围方面的约束条件,也可利用测验信息函数概念来解决。
以上两种测量理论相比,在生成试卷时,经典测量理论指导下的组卷算法可以允许有更多的并不直接属于心理计量学方面的约束条件。综合两种测量理论的优势,可以先按经典测量理论的一般算法,针对全卷总分、题型结构、内容结构、难度结构等多重约束条件,生成符合要求的试卷;然后按项目反应理论信息量最大原则,针对测验要求的达标能力水平值,将已选试题在保持其除难度外的题型、内容等多重要求,在相同要求点上用信息量更大(即难度跟达标水平更相匹配、区分度大而猜测度小)的试题加以替换。只要题库容量足够大,结构合理,总数就可以做出相当大比例的替换,从而实现较明显的优化。
荷兰从20世纪80年代起开始了一系列研究,将数学规划中的线性规划方法引入测量领域,将组卷中的计量学指标(测验项目的难度、区分度、信息量等)和非计量学指标(测验项目的题型、考核内容的章节和重要性程度等信息)有机统一在线性规划的目标函数与约束条件中,然后予以求解,从而实现计算机智能化组卷。加权离差模型(weighted deviations model,WDM)在建立目标函数时可对各约束条件加权。
扩展阅读
- 漆书青,戴海崎,丁树良.现代教育与心理测量学原理.北京:高等教育出版社,2002.