尹华
- 作品数:5 被引量:45H指数:3
- 供职机构:广东财经大学更多>>
- 发文基金:国家自然科学基金广东省高等教育教学改革项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于Scrum敏捷开发的软件实训设计被引量:3
- 2016年
- 针对采用传统过程控制的软件实训类课程中开发文档与编码脱节,学生无法深入理解和应用分析与设计理念等问题,介绍敏捷开发过程的基本思想以及Scrum敏捷开发过程引入软件实训教学中的现状,阐述新的基于Scrum敏捷开发过程的软件实训教学方案以及一套完整的软件实训案例,并总结分析该教学设计方案的有效性。
- 尹华王志坚
- 关键词:软件实训AGILE教学设计
- 基于随机森林的不平衡特征选择算法被引量:33
- 2014年
- 数据高维不平衡是当前数据挖掘的挑战。针对传统特征选择方法基于类别平衡假设,导致在不平衡数据上效果不理想的问题,利用随机森林内嵌的变量选择机制,构造了一个新的不平衡随机森林特征选择算法IBRFVS。IBRFVS在平衡的取样数据上构造多样决策树,采用交叉验证方式获取单棵决策树的特征重要性度量值。各决策树的权重和特征重要性度量的加权平均决定了最终的特征重要性序列,其中,决策树的权重由该决策树与集成预测的一致性程度决定。在UCI数据集上的随机森林超参数选择和预处理对比验证实验中显示,四种超参数K经验取值中,当K的取值为特征数的平方根时,IBRFVS性能较为稳定且优于传统特征选择算法。
- 尹华胡玉平
- 关键词:不平衡数据高维数据
- 一种代价敏感随机森林算法被引量:10
- 2014年
- 数据高维且不平衡时,产生的分类器易过度拟合且倾向于牺牲少数类准确率.为降低分类器复杂度且提高少数类识别率,提出了一种代价敏感随机森林算法.以随机森林算法框架为基础,利用Bagging平衡数据,并在基分类器属性分裂度量以及评价函数中引入误分类和测试双重代价,其中测试代价由分裂属性与少数类的相关度决定,使得基决策树在建模过程中向少数类倾斜.与随机森林和仅引入误分类代价的随机森林相比,引入双重代价的随机森林的分类准确率较高,尤其在少数类识别上具有较大优势.
- 尹华胡玉平
- 基于学科融合的计算机学科人才培养问题研究
- 分析了目前中国高等教育中计算机学科人才培养中的问题及问题产生的原因,提出面向应用行业的IT人才培养思路。以传统经济学领域IT人才需求为例,提出将计算机学科和经济、金融、贸易等传统经济学学科结合,发扬相关学校学科优势,在计...
- 王志坚尹华
- 关键词:学科融合计算机学科
- 文献传递
- 法律案件要素识别混合专家大模型
- 2024年
- 智能司法判决正向符合法律判案逻辑的方向转变。案件要素识别是近年来提出的一项基础任务。相比于前期的基于深度学习和机器阅读理解的识别方法,采用大模型的生成式要素识别方法具有进行复杂推理的潜力。但是,目前司法大模型在这类基础任务上的效果不佳。提出了一种对话式混合专家要素识别大模型。该模型针对案件特点设计了特定的Prompt,供ChatGLM3-6B-base大模型学习;通过全参微调该大模型获得基础要素识别能力,其权重供后续混合专家共享,降低大模型学习成本;针对不同案件类型场景和标签不平衡场景,在大模型的注意力层引入案件DoRA专家和标签DoRA专家模块,提高模型对任务的区分度;设计可学习门控实现标签专家选择。在CAIL2019和某省脱敏盗窃案件要素识别数据集上,对比了三类方法的九个基准模型,并进行模型消融实验。实验结果显示,提出的模型综合性能F1值高于最优模型性能5.9个百分点;在标签不平衡的CAIL2019数据集上,标签专家一定程度上能够减缓数据极度不平衡给模型带来的影响;同时,CAIL2019上训练的模型不再需要全参微调,通过案件专家和标签专家轻量级微调后,在某省盗窃案件中取得最佳效果,证明模型具有易扩展性。
- 尹华吴梓浩柳婷婷张佳佳高子千