您的位置: 专家智库 > >

江西省社会科学规划项目(13JY01)

作品数:12 被引量:59H指数:4
相关作者:涂冬波蔡艳苗莹张龙高旭亮更多>>
相关机构:江西师范大学更多>>
发文基金:江西省社会科学规划项目国家自然科学基金国家教育部博士点基金更多>>
相关领域:哲学宗教更多>>

文献类型

  • 12篇中文期刊文章

领域

  • 12篇哲学宗教

主题

  • 4篇认知诊断模型
  • 4篇计算机
  • 3篇计算机化
  • 3篇测验
  • 2篇自适
  • 2篇自适应
  • 2篇计算机化自适...
  • 2篇Q矩阵
  • 2篇CAT
  • 2篇DINA模型
  • 1篇影响因素
  • 1篇侦查
  • 1篇统计量
  • 1篇判别法
  • 1篇自动组卷
  • 1篇组卷
  • 1篇组卷方法
  • 1篇相关矩阵
  • 1篇相似度
  • 1篇项目功能差异

机构

  • 12篇江西师范大学

作者

  • 12篇涂冬波
  • 8篇蔡艳
  • 2篇丁树良
  • 2篇张龙
  • 2篇高旭亮
  • 2篇苗莹
  • 1篇张心
  • 1篇戴海琦
  • 1篇戴步云
  • 1篇李雪莹
  • 1篇王芳
  • 1篇韩雨婷

传媒

  • 4篇心理科学
  • 3篇心理学报
  • 3篇江西师范大学...
  • 1篇心理学探新
  • 1篇心理科学进展

年份

  • 2篇2017
  • 3篇2016
  • 4篇2015
  • 3篇2014
12 条 记 录,以下是 1-10
排序方式:
基于属性层级关系的rRUM模型优化--模型解释力及判准率的提升视角被引量:1
2016年
以提高认知诊断模型判准率及对数据的解释力为视角,对当前应用较广泛的r RUM模型进行优化(优化后的模型简记为r RUM-AH),并采用Monte Carlo模拟研究及实证研究相结合的范式,比较分析了传统的r RUM模型和r RUM-AH模型的诊断正确率及诊断结果的解释力.研究结果表明:当属性间存在层级关系时,不论在何种实验设计条件下,优化后的r RUM-AH模型属性诊断正确率远远高于传统的r RUM模型;当属性间存在层级关系时,r RUM模型的模式判准率平均不到80%(而r RUM-AH模型平均高达90%以上),难于满足实际需求,此时实际应用者选用该研究新开发的模型是一个较好的选择.
蔡艳涂冬波
关键词:认知诊断模型
多级计分题项目功能差异常用检测方法及比较被引量:8
2015年
项目功能差异是确保测验公平的统计技术手段.多级计分题目为教育测量和心理测量中不可或缺的题型,而目前还未见有公开发表的文章较为全面地将常用多级计分题DIF检测方法作一概括,该文从参数类与非参数类2个视角对多级计分DIF检验方法进行论述与比较,为实践应用者在方法选用上提供借鉴及支持,最后对多级计分DIF检验进行讨论.
张龙涂冬波
关键词:项目功能差异
可修改答案的计算机化自适应测验的方法被引量:2
2016年
与传统的纸笔测验(Paper And Pencil Based Test,P&P)相比计算机化自适应测验(Computerized Adaptive Testing,CAT)根据被试的作答反应自适应地选择题目,它不仅缩短了测验长度,还极大地提高了测验的准确性。然而,目前绝大多数CAT不允许被试修改答案,研究者主要担心修改答案会降低CAT的有效性。允许修改答案符合被试一贯的测验习惯,修改之后的分数更能反映被试真实的水平,从而能够进一步促进CAT在实际中的应用。现有的研究主要从三个方面提出了可修改答案CAT的控制方法:一是测验设计;二是改进选题策略;三是建构模型。未来的研究应进一步探讨这些方法之间的比较与结合,以及对可修改答案认知诊断CAT(Cognitive Diagnostic CAT,CD-CAT)的研究。
高旭亮涂冬波王芳张龙李雪莹
关键词:计算机化自适应测验
认知诊断模型-资料拟合检验统计量及其性能被引量:4
2014年
本文将IRT常用资料-模型拟合检验统计量χ2和G2引入认知诊断领域,具体讨论了这两个统计量在认知诊断资料-模型拟合检验的可行性及其侦查效果,为研究者及实际应用者在认知诊断资料模型拟合检验中提供借鉴及方法学支持。
涂冬波张心蔡艳戴海琦
基于属性多级化的认知诊断计算机化自适应测验设计与实现被引量:13
2015年
本研究在传统CD-CAT的基础上进行拓展,开发设计了可以处理属性多级化的CD-CAT(记为p CD-CAT),而且当测验所有属性的水平数Lk=2时则p CD-CAT可简化为CD-CAT,因此传统CD-CAT是本研究设计开发p CD-CAT的一个特例。Monte Carlo模拟实验结果表明:基于属性多级化框架下设计的p CD-CAT具有较好的诊断正确率、题库安全性和较高的测验效率,弥补了传统CD-CAT不足;当属性多级化时,若采用传统CD-CAT方法,则诊断正确率很不理想(属性模式判准不到30%),表明传统CD-CAT在属性多级化测验情景时不适宜,而本文设计的p CD-CAT是一种不错的选择(属性模式判准高达80%以上)。总之,本研究对于进一步拓展CD-CAT在实践中的应用提供了新方法和新技术支持。
涂冬波蔡艳
哪个测验Q矩阵更合理:基于DINA模型测验Q矩阵合理性侦查指标及其比较与应用被引量:3
2015年
本研究对多个测验Q矩阵的相对合理性的比较与选用开展研究,采用Monte Carlo模拟与实证研究相结合的范式,探讨R_square、HCI、-2LL、AIC、BIC、residual、ABS_residual及本研究新开发的BIC2等八项指标在测验Q矩阵合理性侦查效果及其比较。研究发现:八项指标中,除BIC和BIC2两项指标的对测验Q矩阵相对合理性的平均正确识别率在95%以上,其余指标的平均正确识别率不足90%,整体而言,考虑样本容量及参数个数双重加权的BIC和BIC2两项指标的表现总体上优于其它几项指标;各项指标在不同Q矩阵错误类型下其正确识别率也不尽相同。
蔡艳谭辉晔涂冬波
关键词:DINA模型
基于群体水平评估的认知诊断模型开发与应用被引量:1
2014年
开发了基于群体水平评估的认知诊断模型——G-AHM,用Monte Carlo模拟探讨模型的性能与表现及其在实践中的具体应用。研究发现:(1)G-AHM具有较高的边际判准率、较好的模式判准率和较强的稳健性,说明新模型基本合理可行。(2)与已有较好的认知诊断模型比较发现:从认知状态、属性掌握概率与属性掌握比例三个方面,G-AHM模型所获得的群体诊断结果都与已有结果基本一致,即可认为G-AHM具有较高的效度。特别地,G-AHM将认知状态与群体对属性的掌握概率信息相结合,可更好的解释及分析被试的认知水平,提供的信息更具参考价值。
蔡艳涂冬波丁树良
计算机多阶段自适应测验的组卷方法被引量:2
2017年
计算机多阶段自适应测验(MST)实施的关键是成功组建多个满足测验规范(即统计和非统计约束)的平行测验(或称测验面板),自动组卷(ATA)为实现测验平行提供了可能.现有的MST组卷方法研究主要包括以下几种:1)基于线性规范算法的组卷方法;2)基于启发式算法的组卷方法;3)基于蒙特卡洛算法的组卷方法;4)基于在线组卷的方法.该文讨论这几种方法的优缺点并进行比较,同时指出未来可进一步改进这种方法并开发基于认知诊断测验的自动组卷方法.
李贵玉涂冬波戴步云宗一涛高旭亮苗莹
关键词:自动组卷组卷方法
属性多级化的认知诊断模型拓展及其Q矩阵设计被引量:13
2015年
本研究在传统0-1属性的基础上,拓展出可以处理属性多级化的认知诊断模型——PA-rRUM和PA-DINA模型。Monte Carlo模拟研究表明:拓展模型具有较高的属性诊断正确率和参数估计精度,且参数估计的稳定性较强,说明拓展模型基本可行,可以用于实现多级化属性的认知诊断。这弥补了传统0-1化属性认知诊断模型的不足,具有较好的发展和应用前景;同时本研究还探讨了拓展模型性能及属性多级化下测验Q矩阵的设计。总之,本研究对于进一步拓展认知诊断在实践中的应用提供了重要的方法和技术支持。
蔡艳涂冬波
关键词:认知诊断模型DINA
多级评分的认知诊断计算机化适应测验被引量:20
2016年
本文在0-1评分的CD-CAT基础上,拓展出了适合多级评分CD-CAT(ps CD-CAT)的认知诊断模型及选题策略,为实现多级评分CD-CAT提供了方法支持。Monte Carlo模拟实验结果表明:本文拓展的多级评分CD-CAT具有较理想的属性诊断正确率及测验效率和题库安全性,可以用于多级评分数据的CD-CAT;模拟实验还表明,整体来看PS-PWKL和PS-HKL两种选题策略具有较高属性判准率、题库安全性和高测验效率,且均优于PS-KL选题策略。总之,本研究对于进一步拓展CD-CAT在实践中的应用提供了认知诊断模型与选题策略等。
蔡艳苗莹涂冬波
共2页<12>
聚类工具0