焦丽亚
- 作品数:19 被引量:136H指数:7
- 供职机构:教育部考试中心更多>>
- 发文基金:教育部人文社会科学研究基金国家社会科学基金国家自然科学基金更多>>
- 相关领域:文化科学哲学宗教更多>>
- 测验等值研究综述被引量:3
- 2009年
- 本研究从研究历史、概念界定、数据收集设计、等值模型和等值方法、等值误差及不同等值方法的评价标准等五个方面对测验等值研究进行了文献综述,以期为今后等值研究的进一步开展提供理论基础。
- 焦丽亚
- 关键词:测验等值
- 基于IRT的共同题非等组设计中五种项目参数等值方法的比较研究被引量:7
- 2009年
- 本文采用共同题非等组设计,对五种基于IRT的项目参数等值方法进行比较研究。研究数据来自湖北某试点地区课改实验区和非课改区考生在标准化中考数学科目的考试数据,兼用大样本标准和其他标准作为各等值方法比较的检验标准,以RMSD指标作为操作性检验标准,利用STUIRT程序进行等值分析。研究结果表明,针对本研究所设置的等值情境,MS方法稳健性最差,对于项目难度参数的等值,同时校准方法最好,其次是SL特征曲线法,对于项目区分度参数的等值,MM方法精确性最好。
- 焦丽亚
- 基于IRT等值的共同题设计中五种题目参数等化方法的比较研究
- <正>论文使用模拟研究(simulation study)(模拟200套等组与非等组群体数据,数据与三参数logistic IRT模型拟合)比较了IRT等值下的五种项目参数等化方法。采用共同题等值设计(common it...
- 焦丽亚辛涛
- 文献传递
- Rasch模型在省综合质检测试质量分析中的应用被引量:2
- 2019年
- 运用Rasch模型对2016年福建省综合质检文科英语测试数据进行分析。研究结果表明:实测数据与Rasch模型拟合较好,2016年福建省综合质检文科英语试卷是一套高质量的测验,能够较好区分考生的能力水平;但是,该测验中有个别题目的作答反应与Rasch模型的拟合效果不太理想,测验题目的难度分布也有一定的优化空间,这两点值得命题团队反思和总结,可以服务于教学调整并为下个周期的命题提供有益的测量学参考。
- 朱乙艺姚瑞兰焦丽亚
- 关键词:RASCH模型
- 大规模测评中IRT等值的影响因素研究被引量:2
- 2017年
- 通过模拟和实证研究探讨样本量、题本量以及锚题题型对大尺度测评中项目参数等值精度的影响,模拟研究和实证研究的结果均表明:(1)0/1计分项目参数的等值精度在大多数条件下均好于多级计分项目,相对而言,实证研究的差异不如模拟研究明显;(2)相对而言,样本容量的增加对于提高项目参数等值精度有着重要的作用,而增加题本数量的作用甚微;(3)无论是区分度参数还是难度参数,均表现为3个题本和2 000人的搭配已经可以达到较好的等值精度,如果进一步提高等值精度,只需将每一题本的样本容量增加到3 000人即可;在多级计分时,当选用5个题本时,每一个题本2 000人是最适宜的组合。
- 曾平飞李雨秦刘文惠焦丽亚康春花
- 关键词:项目反应理论等值
- 新课程背景下中考的IRT项目参数等值方法比较研究
- 本研究作为教育部“初中毕业与普通高中招生制度改革”项目2005年度数据分析的后续深入研究,在中考新课程改革的背景下,立足于我国的教育考试实践,以我国规模与影响力较大的教育测验之一——中考为例,收集了项目组试点的湖北省某地...
- 焦丽亚
- 关键词:中考新课程改革
- 文献传递
- 学生能力国际评价项目(PISA)简介与香港PISA2003评价报告的再评价被引量:12
- 2006年
- 按照一定的理论标准对教育评价技术的质量及结论进行评价称为再评价,再评价就是对评价本身的评价,其目的是对评价者指出其评价工作中存在的问题和偏差。通过对评价实践的再评价,有助于反思评价实践中存在的问题,对评价进行监控,并在此基础上做出必要的改进,从而切实发挥评价的功能。再评价的方法分定性和定量两种,其中,内容分析法是最常用的定性分析方法,它是对评价中各种材料的内容及有效性按照评价的目的和要求,进行客观深入的分析和评判的方法。本报告即采用内容分析法对香港PISA2003评价报告进行定性的效度分析。
- 王蕾焦丽亚
- 关键词:PISA2003
- 中学生科学素养的性别差异:基于PISA2015的实证研究被引量:8
- 2017年
- 聚焦科学素养的PISA2015,作为国际上最大的比较教育研究评价项目,为了解我国中学生科学素养的性别差异提供了可靠的工具。对最新公布的PISA2015的测评结果分析显示:我国男生的科学成绩总体上好于女生。在能力维度上,男生在"科学地解释现象"、"科学地解释数据和进行证明"两个子维度上的表现优于女生;在知识维度上,男生在"内容性知识"上的表现优于女生;在内容维度上,男生在"物理"、"地球与空间"两个子维度上的表现优于女生。从科学水平的等级分布来看,男生表现优异的比例高于女生。尽管我国学生科学素养总体较好,但学生科学素养的性别差异及其表现形式值得关注;另外,我国15岁学生未来从事科学相关的职业倾向意识有待引导提升。
- 关丹丹焦丽亚
- 关键词:中学生性别差异PISA
- 基于CTT的锚测验非等组设计中四种等值方法的比较研究被引量:16
- 2006年
- 采用锚测验非等组设计的数据收集方案,对4种基于经典测量理论的等值方法进行了比较研究。研究数据取自TIMSS1999数据库,兼用等值标准误和交叉验证方法作为各等值方法比较的检验标准,利用CIPE程序对实验数据进行分析。研究结果表明,针对本研究所设置的等值情境,线性等值优于等百分位等值,其中Tucker线性方法比Levine观察分数线性方法更好一些,Braun-Holland线性方法不宜采用,频数估计等百分位方法等值误差较大,亦不足取。
- 焦丽亚辛涛
- 关键词:测验等值经典测量理论
- IRT真分数等值方法的假设检验及其应用研究
- 在教育测验实践中,越来越多地采用标准化测验来评价考生的能力,如何确保测验结果的公平性和精确性是研究者面临的重大挑战。为了确保不同测验版本上的分数可比,就需要对测验分数进行等值处理。等值所采用的数据收集设计、选用的测量模型...
- 焦丽亚
- 文献传递