国家自然科学基金(31100759)
- 作品数:13 被引量:174H指数:5
- 相关作者:刘红云骆方刘源张玉王珊更多>>
- 相关机构:北京师范大学香港中文大学四川省教育科学研究所更多>>
- 发文基金:国家自然科学基金全国教育科学“十二五”规划教育部重点课题教育部人文社会科学研究基金更多>>
- 相关领域:哲学宗教自动化与计算机技术更多>>
- 多维测验项目参数的估计:基于SEM与MIRT方法的比较被引量:6
- 2012年
- 作者简要回顾了SEM框架下分类数据因素分析(CCFA)模型和MIRT框架下测验题目和潜在能力的关系模型,对两种框架下的主要参数估计方法进行了总结。通过模拟研究,比较了SEM框架下WLSc和WLSMV估计方法与MIRT框架下MLR和MCMC估计方法的差异。研究结果表明:(1)WLSc得到参数估计的偏差最大,且存在参数收敛的问题;(2)随着样本量增大,各种项目参数估计的精度均提高,WLSMV方法与MLR方法得到的参数估计精度差异很小,大多数情况下不比MCMC方法差;(3)除WLSc方法外,随着每个维度测验题目的增多参数估计的精度逐渐增高;(4)测验维度对区分度参数和难度参数的影响较大,而测验维度对项目因素载荷和阈值的影响相对较小;(5)项目参数的估计精度受项目测量维度数的影响,只测量一个维度的项目参数估计精度较高。另外文章还对两种方法在实际应用中应该注意的问题提供了一些建议。
- 刘红云骆方王玥张玉
- 关键词:验证性因素分析参数估计分类数据
- 多阶段混合增长模型的影响因素:距离与形态被引量:17
- 2014年
- 通过模拟研究,考察潜类别距离和发展形态等因素对多阶段混合增长模型的模型选择和参数估计的影响:(1)潜类别距离越大,模型选择和分类效果越好。(2)混合模型的选择,应以一定样本量(至少200)为前提,首先考虑BIC选出正确的分类模型,再通过熵值、ARI等选择分类确定性较高的模型。(3)多阶段的发展形态对正确模型的选择和分类的确定性均有一定程度影响。(4)潜类别距离和样本量越大,参数估计精度越高。(5)在判断分类准确性的指标中,ARI的选择更偏向于真实的模型。
- 刘源骆方刘红云
- 潜变量量尺的拓展及研究展望被引量:4
- 2015年
- 随着潜类别分析(LCA)技术的发展,研究者对于总体异质性的问题越来越关注。在潜变量量尺拓展之后,潜类别模型的方法也被广泛的应用到各领域。在横断研究中,LCA与混合因素分析模型(FMA)常被使用在探索总体分群和因素分群的研究中;在追踪研究中,潜类别转换分析(LTA)重点讨论群的调节作用和分类结果随时间变化的不同,而潜类别增长分析(LCGA)和混合增长模型(GMM)则关注发展趋势;多水平模型(MLM)也针对嵌套数据应用在横断与追踪研究中,衍生出近年来成为热点的多水平混合模型(MMM)。
- 刘源刘红云
- 基于增长模型的非随机缺失数据处理:选择模型和极大似然方法被引量:4
- 2015年
- 对含有非随机缺失数据的潜变量增长模型,为了考察基于不同假设的缺失数据处理方法:极大似然(ML)方法与DiggleKenward选择模型的优劣,通过Monte Carlo模拟研究,比较两种方法对模型中增长参数估计精度及其标准误估计的差异,并考虑样本量、非随机缺失比例和随机缺失比例的影响。结果表明,符合前提假设的Diggle-Kenward选择模型的参数估计精度普遍高于ML方法;对于标准误估计值,ML方法存在一定程度的低估,得到的置信区间覆盖比率也明显低于Diggle-Kenward选择模型。
- 陈楠刘红云
- 多阶段增长模型的方法比较被引量:9
- 2013年
- 多阶段增长模型(Piecewise Growth Modeling,PGM)可以解决发展趋势中具有转折点的情形,并且相对其他复杂的曲线增长模型,解释更简单。已有的统计方法主要通过多层线性模型和潜变量增长模型对多阶段模型进行估计。通过模拟研究,用HLM6.0和Mplus6.0对上述两种模型分别进行估计,结果发现在参数估计的精度上,两种估计方法没有差异,只是在犯一类错误的概率上后者略小。进一步通过对错误模型的探讨发现,在样本量小(n=50),斜率变化小(Δb=0.2)时,用线性模型拟合数据而非PGM所犯错误概率较小,整体拟合更佳。但随着样本的增加和斜率变化的增加,错误模型的犯错概率明显增大。故在实际应用中,为了能更好拟合数据,研究者应根据数据本身的情况选择恰当的模型。
- 刘源赵骞刘红云
- 关键词:参数估计
- 分类数据测量等价性检验方法及其比较:项目阈值(难度)参数的组间差异性检验被引量:3
- 2012年
- 测量工具满足等价性是进行多组比较的前提,测量等价性的检验方法主要有基于CFA的多组比较法和基于IRT的DIF检验两类方法。文章比较了单维测验情境下基于CCFA的DIFFTEST检验方法和基于IRT模型的IRT-LR检验方法,以及多维测验情境下DIFFTEST和基于MIRT的卡方检验方法的差异。通过模拟研究的方法,比较了几种方法的检验力和第一类错误,并考虑了样本总量、样本量的组间均衡性、测验长度、阈值差异大小以及维度间相关程度的影响。研究结果表明:(1)在单维测验下,IRT-LR是比DIFFTEST更为严格的检验方法;多维测验下,在测验较长、测验维度之间相关较高时,MIRT-MG比DIFFTEST更容易检验出项目阈值的差异,而在测验长度较短、维度之间相关较小时,DIFFTEST的检验力反而略高于MIRT-MG方法。(2)随着阈值差值增加,DIFFTEST、IRT-LR和MIRT-MG三种方法的检验力均在增加,当阈值差异达到中等或较大时,三种方法都可以有效检验出测验阈值的不等价性。(3)随着样本总量增加,DIFFTEST、IRT-LR和MIRT-MG方法的检验力均在增加;在总样本量不变,两组样本均衡情况下三种方法的检验力均高于不均衡的情况。(4)违背等价性题目个数不变时,测验越长DIFFTEST的检验力会下降,而IRT-LR和MIRT-MG检验力则上升。(5)DIFFTEST方法的一类错误率平均值接近名义值0.05;而IRT-LR和MIRT-MG方法的一类错误率平均值远低于0.05。
- 刘红云李冲张平平骆方
- 关键词:分类数据验证性因素分析项目功能差异
- 迫选式人格测验的传统计分与IRT计分模型被引量:9
- 2014年
- 迫选测验的传统计分方式会产生自模式数据,不能进行传统的信效度检验、因素分析和方差分析等。近年来研究者提出了一些基于项目反应理论的计分模型,如瑟斯顿IRT模型和MUPP模型等,它们可以规避自模式数据的弊端。瑟斯顿IRT模型方便进行参数估计,模型定义灵活;而MUPP模型的拓展性较差,参数估计的方法有待提高。另一方面,已有研究者基于MUPP模型开发了一些抗作假的迫选测验,而瑟斯顿IRT模型距离这种应用还比较远。此外,两个模型的适用性和有效性都有待更多的实证研究来检验。
- 王珊骆方刘红云
- 因变量为等级变量的中介效应分析被引量:123
- 2013年
- 本文聚焦于因变量为等级数据的中介效应模型,通过模拟研究比较了Logistic回归与通常线性回归的差别,并比较了这两种分析框架下常用的系数乘积法和系数差异法的优劣,同时考察了因变量类别数对估计结果的影响。研究结果表明:对因变量为等级数据的中介效应模型,应使用Logistic回归进行分析,如果使用了通常线性回归分析,会导致中介效应低估、标准误低估、置信区间对真值覆盖比例偏低等问题。对于等级因变量的中介效应估计,系数乘积法得到的结果优于系数差异法,随着等级数的增加Logistic回归与通常线性回归的差别越来越小,当因变量的类别数较多(5及以上)时,可考虑使用通常线性回归的分析方法。最后通过一个实例说明了该方法的应用。
- 刘红云骆方张玉张丹慧
- 关键词:蒙特卡洛模拟
- 基于多级计分题目的分步功能差异检验
- 2014年
- 对分步功能差异如何在项目功能差异的检测和解释中发挥作用进行阐述:(i)从国外分步功能差异的模型、方法原理、分类模式、应用和结果解释等方面对这一方法的进展和应用情况进行概括和综述,旨在对国内测验公平性的研究提供借鉴;(ii)通过实际测验的数据,采用DSF分析的方法对测验中题目及不同等级分数的DIF进行了检验,进而对产生DIF的原因进行更深入的分析,以对测验内容的审核和题目的修订提供更具体和具操作性的依据.
- 李美娟刘红云
- 关键词:项目功能差异
- 不同铆测验设计下多维IRT等值方法的比较被引量:5
- 2013年
- 实际应用中测验往往具有多维结构,如果仍采用单维IRT方法进行等值,会得到不准确的结果。因此对于多维结构的测验,需要使用多维IRT等值方法来实现参数的转换。基于共同题设计,文章通过模拟研究的方法,考察了不同铆测验设计下几种多维IRT等值方法的表现,同时考虑了测验长度、两个维度题目数量的比例、铆测验长度、铆测验的选择策略、两个维度之间的相关和等值群体的能力水平差异六个因素的影响。所比较的多维IRT等值方法有:均值/均值(MM)方法,均值/标准差(MS)方法,Stoking-Lord(SL)方法,Haebara(HB)方法,最小平方(LS)方法。结果显示:(1)SL,HB和LS方法得到的等值误差均方根最小,且在各条件下表现较为稳定。(2)MM和MS方法在非等组条件下呈现出很大的误差均方根。(3)铆测验设计对SL,HB和LS方法的等值结果没有显著影响。(4)在两个维度之间的相关较高,测验长度和铆测验长度较长,等值群体的能力水平没有差异的条件下,SL,HB和LS方法得到的等值误差均方根最小。
- 刘玥刘红云
- 关键词:测验等值均值均值