刘勇 作品数:18 被引量:31 H指数:4 供职机构: 北京化工大学信息科学与技术学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 社会学 经济管理 更多>>
数据驱动的程序设计类课程创新改革与实践 2023年 时代的发展推动程序设计类课程创新改革步伐,如何利用现代化手段助力课程创新是当前教育关注的焦点。文章以程序设计类课程为例,针对课程存在的问题,从课程闭环支撑平台建设、BOPPPS有效教学结构设计和科技育人融入三个方面,探讨数据驱动的程序设计类课程创新改革方法与实践探索。 史晟辉 张红 彭四伟 胡伟 江志英 刘勇 汪凌峰 李睿琪以OJ系统和学科竞赛为核心的程序设计实践教学 被引量:11 2021年 通过分析各高校在线评测系统应用于实践教学的现状,结合北京化工大学在线评测系统应用实际,对九年来的计算机科学与技术专业的编程课程教学实践和程序设计类学科竞赛的培养情况进行数据分析和整理研讨。经验表明,文章分析的以在线评测系统为基础,以学科竞赛为目标的实践教学模式有利于培养优秀的计算机科学与技术专业学生。 刘勇 田凯 周晓琳 吴佳伟关键词:学科竞赛 实践教学 基于机器学习识别偶然正确测试用例 2024年 基于频谱的故障定位(Spectrum-Based Fault Localization,SBFL)技术已被广泛研究,可以帮助开发人员快速找到程序错误位置,以降低软件测试成本。然而,测试套件中存在一种特殊的测试用例,其执行了错误的语句但能输出符合预期的结果,这种测试用例被称为偶然正确(Coincidental Correct,CC)测试用例。CC测试用例会对SBFL技术的性能产生负面影响。为了减轻CC产生的负面影响,提升SBFL技术性能,文中提出了一种基于机器学习的CC测试用例识别方法(CC test cases Identification via Machine Learning,CCIML)。CCIML结合怀疑度公式特征和程序静态特征来识别CC测试用例,从而提高SBFL技术的故障定位精度。为了评估CCIML方法的性能,文中基于Defects4J数据集进行对比实验。实验结果表明,CCIML方法识别CC测试用例的平均召回率、准确率和F 1分数分别为63.89%,70.16%和50.64%,该结果优于对比方法。除此之外,采用清洗和重标策略处理CCIML方法识别出的CC测试用例后,最终取得的故障定位效果也优于对比方法。其中,在清洗策略和重标策略下,错误语句怀疑度值排在第一位的数量分别为328和312,相比模糊加权K近邻(Fuzzy Weighted K-Nearest Neighbor,FW-KNN)方法,定位到的故障数量分别增长了124.66%,235.48%。 田帅华 李征 吴永豪 刘勇关键词:软件测试 故障定位 特征提取 面向程序设计竞赛的人才培养模式实践与探索 被引量:1 2020年 课题组以ACM/ICPC国际大学生程序设计竞赛队员培养体系研究为核心,结合北京化工大学多年来的程序设计竞赛集训队培养经验,面向程序设计竞赛人才培养总结出一套完整的体系,核心内容包括信息化系统建设、分级训练、重视团队协作和促进校内比赛等。经过多年的实践,证明课题组提出的这套培养模式可行有效,学校程序设计竞赛水平得到了显著提高。 周晓琳 解静 刘勇 尤枫 吴佳伟关键词:ACM/ICPC 程序设计竞赛 基于图卷积神经网络的函数自动命名 被引量:1 2021年 函数自动命名技术旨在为输入的源代码自动生成目标函数名,增强程序代码的可读性以及加速软件开发进程,是软件工程领域中一项重要的研究任务.现有基于机器学习的技术主要是通过序列模型对源代码进行编码,进而自动生成函数名,但存在长程依赖问题和代码结构编码问题.为了更好的提取程序中的结构信息和语义信息,本文提出了一个基于图卷积(Graph Convolutional Network,GCN)的神经网络模型—TrGCN(a Transformer and GCN based automatic method naming).TrGCN利用了Transformer中的自注意力机制来缓解长程依赖问题,同时采用Character-word注意力机制提取代码的语义信息.TrGCN引入了一种基于图卷积的AST Encoder结构,丰富了AST节点特征向量的信息,可以很好地对源代码结构信息进行建模.在实证研究中,使用了3个不同规模的数据集来评估TrGCN的有效性,实验结果表明TrGCN比当前广泛使用的模型code2seq和Sequence-GNNs能更好的自动生成函数名,其中F1分数分别提高了平均5.2%、2.1%. 王堃 李征 刘勇基于编程认知诊断模型的学生表现预测 被引量:1 2023年 近年来,学生认知诊断是教育数据挖掘领域的重要研究课题,对现代教育的精准反馈有重要的意义.然而,传统的认知诊断模型存在预测准确性低和处理大规模数据时效率低等问题,且现有研究主要围绕传统线下教学展开,缺少针对程序设计教育领域的研究.为了解决上述问题,本文从程序设计教育的特点分析出发,提出了一种基于编程表现的模糊认知诊断模型P-FuzzyCDF (programming-performance-based fuzzy cognitive diagnosis framework).具体来说,为了处理编程题部分正确的情况,该模型首先模糊了学生对知识点的掌握情况.随后, P-FuzzyCDF将模糊集合理论与教育假设相结合,对学生对问题的掌握情况进行了建模.除此之外,本文还考虑抄袭因素,并最终生成学生在每个问题上的得分.值得注意的是,该模型利用编程教育数据可视化和精确性的特点,对模型中每个部分的参数进行了量化.本文基于真实数据集进行实验,实验结果表明P-FuzzyCDF可以实现较高的精度,其中MAE、MSE和RMSE评估指标的值分别为0.07、0.09和0.01.此外,将P-FuzzyCDF与现有经典方法 (如DINA, IRT和FuzzyCDF)进行比较时, P-FuzzyCDF的结果在MAE、MSE和RMSE等指标上取得了明显优势. 张雨婷 李征 刘勇 吴永豪关键词:在线教育 基于层次注意力机制的源代码迁移模型 2023年 针对源代码迁移模型存在的迁移代码语义一致性问题,在词符注意力机制的基础上引入了语句注意力机制,提出了一种基于层次注意力机制的源代码迁移模型HPGN(hierarchical pointer-generator network),设计了状态传递机制。HPGN在迁移过程中,语句注意力机制对齐源代码语句和迁移代码语句的特征,词符注意力机制从对齐的代码语句中提取词符,状态传递机制传递相邻迁移代码语句的特征,从而提升了迁移代码的语义一致性。在真实项目数据集的实验结果表明,HPGN比最佳对比模型提高了3.4个总体分值,同时有着更少的模型参数量。此外,消融实验验证了状态传递机制和HPGN层次架构的有效性。 李征 徐明瑞 吴永豪 刘勇 陈翔 武淑美 刘恒源关键词:机器翻译 “双改革”举措下的实践教学管理模式的探析 2022年 本文以北京化工大学ACM竞赛团队为例,阐述以ACM竞赛系统为技术支撑,在“双改革”举措下对实践教学管理模式进行探索研究,通过实践课程教学改革、竞赛管理改革以及一、二课堂分阶竞赛体系的联动,形成了具有独特形式的实践教学管理模式,进一步促进了实践教学管理体系的完善,推动了工程实践教育的深化改革,在很大程度上加大了本科实践环节教学深度。 吴佳伟 周晓琳 刘勇 李大字 王歆然关键词:实践教学 基于继承模式的故障诊断专家系统研究 被引量:1 2013年 故障诊断专家系统在工程实际应用中发挥了越来越重要的作用,目前的专家系统随着规则数量的增多,造成知识库的不断扩大,降低推理引擎的工作效率。提出了基于继承模式的故障诊断专家系统,利用面向对象技术继承性和多态性的特点,对规则进行定制设计,允许在一套通用的规则基础上,根据具体情况做进一步定制优化。基于该方法设计的专家系统大大提高了诊断的准确性,并在工程应用中收到了良好的效果。 侯超伟 马波 刘勇 张少峰 唐斌关键词:专家系统 面向对象技术 继承性 多态性 基于TMS320F2808的音频频率数字扫频仪 2011年 提出了一种基于TMS320F2808的音频频率数字扫频仪的设计方法,详细介绍了由DSP(digital signal processor)产生正弦扫频信号和幅频特性测量的核心算法与实现过程。通过这种方案设计的扫频仪,能够测出被测带阻网络在20 Hz^20 kHz范围内的幅频特性,并将测量结果传送给PC机显示和存储。 何苏勤 吕咸亮 刘勇 王小庆关键词:DSP 幅频特性