基于等级IRT模型的多级PFS对心理测验中典型偏差反应的检测性能

来源 :中国心理学会,江苏省心理学会 | 被引量 : 0次 | 上传用户:sttyuanchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  个人拟合指数的相关研究日益受到关注,但由于多级计分测验分析的繁杂性,使得个体反应偏差在多级计分心理测验中的识别是国内外很少有人研究的领域.本研究在二级个人拟合指数(PFS)的基础上,基于等级IRT模型创造性地提出了多级计分心理测验中几个参数个人拟合指数的检测公式,并按照检测需要依据不同偏差类型、偏差个体比例及测验长度对两种多级计分测验的模拟数据进行对比分析,比较了各种实验条件下指数对作假行为识别的错误率,从而检验指数的检测性能.采用MCMC运算法则模拟数据,在SAS11.0环境下编写程序代码,按照实验要求模拟得分模式.偏差样本采用3×3×3×2的四因素实验设计模式生成,分别为偏差类型(期望反应、掩饰反应、趋中反应)、偏差个体比例(10%、20%、40%)、测验长度(30、50、80)以及计分等级:分三级(0、1、2)和五级(0、1、2、3、4)计分两种.为使得对PFS的检测性探究更接近实际情况,采用MULTILOG7.0软件依据不同实验条件下产生的项目反应模式得出估计能力.分别对同一个体的真实能力θ和估计能力两种能力水平情况下不同拟合指数进行计算,每个个体同一拟合指数得出两个值,并对相同实验条件的两种指数值的Ⅰ、Ⅱ错误率(即漏报率和虚报率)等检测性能进行比较分析.结果显示:在等级IRT模型的基础上,ECI4指数对三级和五级计分心理测验中期望、掩饰、趋中三种异常反应十分敏感,LnU和LnW指数可以在一定程度上识别出期望和掩饰行为,但对趋中反应的检测力不高;而ECI4及LnU两个指数在中长测验中体现了较少的错误率;利用能力的估计值计算出的拟合指数检测性能基本达到检测要求.总体而言,基于等级IRT模型扩展后的多级个人拟合指数检测力在可接受的范围内,基本可以检测出多级计分心理测验中典型的偏差行为,不同指数漏报率及虚报率受偏差类型、偏差个体比例和测验长度等因素影响.
其他文献
近些年,神经网络和决策树越来越多地被用于人类认知行为的分类和预测研究,神经网络是联结主义方法的代表,而决策树则是符号处理方法的代表.神经网络是一种高效的分类方法,它是由大量的处理单元互相连接而成的网络,进行识别和训练,而且不需要先验知识.决策树则是采用自顶向下的贪心算法,在每个结点选择分类效果最好的属性,继续这一过程直到该树能准确地分类训练样本,或所有的属性都已经使用过.本研究探讨了神经网络与决策
心理软计算是心理学和软计算结合的产物。软计算是在生物界现象启迪下提出的理论和方法,包括神经网络、遗传算法、粒子群、蚁群算法、支持向量机、模糊集、粗糙集等,它能够对模糊的、粗糙的数据进行分析,能够对变量间不清晰的关系进行建模。
作为新一代教育测量的核心的认知诊断评估倍受关注,认知诊断评估利用被试在标定了项目属性的测试项目上的作答反应,对被试知识、技能或属性的掌握情况进行推断或分类,反馈测试结果给学生、老师等以供补救教学之用。
计算机化自适应测验(CAT)的实施需要大型题库,题库中的项目要有项目参数,目前参数估计多采用统计方法(漆书青等人,2002),它需要有较多的被试和较多的项目,对于样本容量较少的测验,用统计的参数估计方法可能会出现不收敛或精度不够等问题。
研究目的:修订人际价值观环形量表(Circumplex Scales of Interpersonal Values,CSIV),并对其进行信效度检验,以期为未来临床工作评估个体的人际适应发展程度及病理心理机制的研究提供有效、简便的测量工具。研究内容:(1)对量表理论进行文献调研;(2)修订CSIV:根据预调研资料、初测项目分析结果修改CSIV项目,确定CSIV翻译稿;采用方便抽样,对725名大学
现有有关自我宽恕的界定往往缺乏人际间特征与个体内特征的整合.除此之外,本土化研究表明,中国社会是一个“自我主义”社会,相对于西方人的“独立型自我”,中国人更偏向于“互倚型自我”.因此,整合自我宽恕的个体内特征和人际间特征是编制适用于中国大学生的自我宽恕倾向问卷的不可或缺的一部分.在前人有关自我宽恕界定的基础之上,弥补前人研究之不足,结合本土文化,提出自我宽恕倾向的涵义为:个体意识到自己的错事之后,
测验维度是数据背后的潜在能力或者构念的个数以及他们之间的关系.维度评估是一个既有统计学意义又有本质意义的探索项目与潜在变量(特质)的关系,以及项目与维度之间的关系的过程.统计上的意义是确定维度的个数,本质上的意义是确定维度之间、以及项目与维度之间的关系.通过检验测验的维度,研究者就可以将统计结果与本质意义结合起来,达到更好的解释被试与题目的相互作用的目的.对多维测验的维度结构的评估方法有很多,以往
多阶段混合增长模型(Piecewise growth mixture modeling,PGMM)可以同时考察发展趋势不连续和发展群体不同质的问题,在实际研究中具有特殊作用.通过模拟研究,考察潜类别距离和发展形态等因素对模型选择和参数估计的影响,得到以下结论:(1)潜类别距离影响模型选择和分类效果.潜类别间距离较大时,BIC、熵值表现出一致性,均能选出正确的模型,得到正确的分类结果;但当潜类别间的
等值的研究对于考试的公平性、题库建设、教学质量评价和计算机自适应测验都具有重要的意义.随着考试研究的发展,题组形式越来越多地出现在测验中.如何更精确地对含题组的测验等值便成为一大难题.早期多采用项目反应理论(Item Response Theory,IRT)模型进行测验等值,需要满足局部独立性(LI)假设.然而,先前的研究表明,在包含题组的测试中通常存在局部依赖,违背了LI假设.若采用标准的IRT
项目反应理论下的测验信度(以下简称IRT信度),能够评价潜在特质估计的可靠性、稳定性,是测验分数精度和稳定性的宏观指标,而测验信息函数和项目信息函数是测验分数精度和稳定性的微观指标,故二者不可相互替代.现有的IRT信度及其估计值的影响因素研究,以及IRT信度估计方法的比较研究,并未涉及模型-数据资料拟合度.本研究将模型-数据资料拟合度以及信度估计方法作为自变量,能够为不同模型-数据资料拟合度水平下