尹春林
- 作品数:4 被引量:6H指数:2
- 供职机构:云南大学软件学院更多>>
- 发文基金:云南省教育厅科学研究基金国家自然科学基金云南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 利用RNNLM面向主题的特征定位方法被引量:2
- 2017年
- 软件特征定位是软件演化活动顺利展开的保证。基于文本的特征定位方法是目前特征定位研究的一个重要组成部分。当前基于文本的特征定位方法将代码关键词视为独立同分布的个体,忽略了代码间的语境。针对上述问题,基于深度学习语言模型RNNLM(recurrent neural networks language model)提出了一种源代码主题建模方法,并在此基础上实现了特征定位。实验结果表明,与基于LDA(latent Dirichlet allocation)和LSI(latent semantic indexing)的文本特征定位相比较,查准率提高8.61%和2.61%,表明该方法具有较优的查准率。
- 尹春林王炜李彤李彤熊文军何云
- 关键词:主题建模
- 一种软件特征定位研究结果的评估方法被引量:1
- 2017年
- 软件特征定位是软件演化得以成功实现的重要前提条件,且软件特征定位实验结果的评估标准直接关系到软件演化活动的适用范围。当前软件特征定位结果的评估方法通常采用实验检索结果的10%~15%检索量来进行下一步的定位实验,会不可避免地造成查找范围过大且查准率过低的情况。同时,由于特征定位相关领域新技术的出现,急需一种新的特征定位研究结果的评估方法来提升特征定位的效率。通过多次实验的总结,结合波及效应分析及当前使用的一些评价实验结果的方法,认为每次定位出一个源代码文件,恰好该源文件也是特征相关的源代码文件为最理想的特征定位。为此,提出一种新的实验结果评估方法,将检索量从实验数据总数的10%~15%降到1个实验数据。数据分析结果表明,由所提出的评估方法所获得的特征定位结果可以有效地缩小软件演化的范围并提高软件演化的效率。
- 尹春林王炜李彤蒋巍
- 关键词:查准率
- 面向Issue跟踪系统的变更请求报告关闭可能性预测被引量:2
- 2017年
- 在Issue跟踪系统中存在大量长期未关闭的变更请求报告,增加了开发者不断点击和阅读这些报告的可能性,严重影响了软件需求管理任务的实施和用户的反馈体验。准确和及时地预测这些报告关闭的可能性或重要性可以提高软件维护任务的质量。定义若干衡量变更请求报告特征的指标,选择在训练数据集上预测效果最佳的指标构建Logistic回归预测模型。使用提出的方法对20个SourceForge项目构成的测试数据集进行实验,得到平均查全率为94%和平均伪正率为14%的结果。实验结果表明,提出的方法能在测试数据集上取得很好的预测性能;关闭状态的变更请求报告所占的百分比或数量大小并不影响模型的性能;变更请求报告具有的某些特征可用于预测其在下一版本中得到关闭的可能性。
- 熊文军张璇王旭王旭李彤
- 基于RNN进行面向主题的特征定位方法被引量:2
- 2017年
- 软件特征定位是软件演化活动得以顺利展开的前提条件。当前特征定位研究的性能仍有待于进一步提高。为了获得较好的性能,在文件夹粒度上获取主题知识,将系统中同一个文件夹下的所有类(class)划分为同一个主题知识类,提出利用深度学习算法——循环神经网络RNN(Recurrent Neural Networks)进行面向主题的特征定位。同时,在该方法的基础上提出了一种改进的模型。为了使实验结果更具现实意义,与基线方法和其他一些方法相比,将实验数据从10组提高到531组和将检索率从15%缩小到10%,即使在这种情况下,所获得的实验结果,无论是从正面与基线方法相比还是从侧面与目前的一些特征定位方法相比,该方法都获得了不错的性能。
- 尹春林王炜李彤何云
- 关键词:循环神经网络面向主题