首页 . 理学 . 心理学 . 心理测量学 . 多维项目反应理论

多维项目反应理论

/multidimensional item response theory;MIRT/
条目作者涂冬波

涂冬波

最后更新 2022-01-20
浏览 243
最后更新 2022-01-20
浏览 243
0 意见反馈 条目引用

在单维项目反应理论的基础上发展起来,主要用于分析数据是多维潜变量测验情境的测量理论。

英文名称
multidimensional item response theory;MIRT
所属学科
心理学

随着项目反应理论(IRT)在实际工作中的广泛运用,人们逐渐发现,传统IRT的单维性假设与许多心理或教育测验的实际是不相符的,测验数据的多维性与人在完成一项测验任务时需要多种能力的共同配合是相符的,很少有测验只测量单一维度能力或特质。传统IRT处理多维测验的方法是将其分成若干个子测验,在子测验内部维护单维性,在子测验之间采用线性组合的方法把多种能力合成为一维量表,这对于测验的宏观分析也许是有理由的,但是如果某些项目本身就具备多维性,那么这种处理办法就遇到了麻烦。另外,由于这些子测验或维度之间存在某种程度的相关,每次单独分析一个子测验或一个维度的方法,忽略了各子测验之间的关系,因而用单维模型拟合多维数据会增大测量误差,对被试的能力水平作出不正确的推论。因此,无论是从理论还是技术而言,都需要把传统的IRT拓展为多维项目反应理论。多维项目反应理论是测验理论发展的主要进展之一。

MIRT引入多维能力、多维项目区分度等参数模拟测验项目和被试间的相互作用,采用概率模型来表征具有特定多维能力水平的被试正确答对特定项目的概率。一方面,MIRT能同时估计被试在测验每个维度上的能力水平,实现测验的认知诊断功能;另一方面,MIRT比单维项目反应理论(UIRT)更适用于分析许多新形式的测验,如认知诊断测验、公务员考试、表现性评估及写作测验的项目和被试特征。

多维项目反应理论的发展源于项目反应理论和因素分析(FA),因兼具项目反应理论和因素分析的双重优点,而被广大研究者及应用者所重视。MIRT与大多数FA的不同之处在于,它认为输入变量(项目)的特征变化是重要的、值得研究的,而FA认为输入变量的特征区别(如均值、标准差、信度等)是可去除的。由于对这种变量特征的缺失,大多数FA的研究开始于分析相关矩阵,而相关矩阵的数据都是来自所有被忽略掉均值和标准差的变量。一些计量学家意识到传统因子分析的一些缺陷,提出了利用完整信息的项目反应矩阵,对被试心理特质与项目反应之间的关系用非线性概率模型来表达,建立了FA与IRT之间的连接,从而产生了实质上的MIRT模型。

多维度项目反应模型是一个非线性的用来表征题目参数、被试的潜在能力和其正确回答题目的概率之间关系的数学函数,通过这个模型可以分别推断被试的多个特质。根据完成任务时某一能力维度上的不足是否可以被其他优势能力所补偿可将MIRT分为补偿模型和非补偿模型。补偿模型即被试各维度之间通过线性组合的形式来决定题目的作答反应结果,这意味着,某个维度上的不足可以通过另外一个维度上的高水平表现来得到补充,从而获得与别人一样的作答效果。这类模型假设,在某个题目上相同的得分概率,可以从不同特质维度的互补中得到,被试在各个维度上非均衡发展,同样可以得到相同的分数。正如高考分数一样,相同的总分可能是由不同科目之间的各种组合模式得到,在其中一个科目上表现失常,可以通过其他科目的上佳表现得到补充。而非补偿模型则假设某个维度上的不足不可以通过另外一个维度上的高水平表现来得到补充,被试只有在各个维度上均衡发展,才能得到较高的项目答对概率。

MIRT待估参数的个数比UIRT更多,参数估计的复杂度也更高。因此MIRT参数估计问题也引起了心理测量学者们的关注。MIRT能力条件估计方法主要有极大似然估计、极大后验估计、期望后验估计等。

①在教育和心理测验的实践中,大多数测验工具本质上都是多维的。根据测验蓝图,如果子测验测量了不同的内容领域或认知技能,则这些项目有可能代表了不同的维度。维度分析应该是每个测验施行后所执行的标准分析系列的一部分,相关测验数据矩阵需用多维模型来精确地反应被试和测验项目的交互作用,即使那些报告单一分数的测验以及应用单维IRT模型来报告分数的测验,都具有复杂的内容细目。这也意味着测验项目的正确反应需要多重技能和知识,此时需要应用多维模型来对项目反应数据模型化。②由于MIRT关注测验项目与被试特质的交互作用,同时兼具FA和IRT的双重特征,MIRT不仅可以提供效度证据,而且可以为测验发展过程反馈信息。MIRT分析可以为测验结果的报告、测验分数的合理使用和解释提供证据。如果测验的结果被报告成一个单一分数,则其蕴含的假设是所有的项目测量了相同的技能(属性)。当测验测量了多个特质时,就需要报告多重分数,多维模型可以为教师或研究者提供更多的信息,而基于单维模型的分类往往会出现对某一部分被试错分的现象。③在项目功能差异(DIF)的侦查方面,MIRT为描述产生DIF的原因提供了本质上的解释,认为造成项目出现DIF的原因就是它测量的维度超出了测量目标。

相关条目

阅读历史

    意见反馈

    提 交

    感谢您的反馈

    我们会尽快处理您的反馈!
    您可以进入个人中心的反馈栏目查看反馈详情。
    谢谢!