您的位置: 专家智库 > >

杨荣杰

作品数:5 被引量:42H指数:3
供职机构:辽宁师范大学计算机与信息技术学院更多>>
发文基金:国家自然科学基金辽宁省科学技术计划项目辽宁省教育厅高等学校科学研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 3篇文本
  • 3篇文本特征
  • 2篇信息增益
  • 2篇数据集
  • 2篇文本分类
  • 2篇不平衡数据
  • 2篇不平衡数据集
  • 1篇散度
  • 1篇统一计算设备...
  • 1篇相互作用
  • 1篇相互作用能
  • 1篇消息传递接口
  • 1篇离散度
  • 1篇接口
  • 1篇计算设备
  • 1篇架构
  • 1篇贝叶斯
  • 1篇贝叶斯分类
  • 1篇RELIEF...
  • 1篇CUDA

机构

  • 5篇辽宁师范大学

作者

  • 5篇杨荣杰
  • 4篇任永功
  • 3篇尹明飞
  • 2篇马名威
  • 1篇杨雪
  • 1篇胡志冬
  • 1篇宫利东
  • 1篇刘青昆

传媒

  • 3篇计算机科学
  • 2篇计算机应用与...

年份

  • 1篇2013
  • 4篇2012
5 条 记 录,以下是 1-5
排序方式:
基于组合特征的动态垃圾博客过滤算法被引量:2
2012年
近几年,垃圾博客过滤成为国际上新的热点研究领域。现有的过滤算法大多基于词频特征分类,特征冗余并缺乏关联性。为了解决此问题,提出一种基于组合特征的动态垃圾博客过滤算法(CFDSD),该算法采用作者属性和自相似特征来解决特征冗余和关联性低的问题,并应用贝叶斯分类算法优化词频特征分类。实验表明,该算法能适应博客随时间变化而动态更新的特点,同时提高了过滤效率。
任永功尹明飞杨荣杰
关键词:贝叶斯分类
基于MPI+CUDA环境的静电相互作用能并行求解被引量:1
2012年
ABEEMσπ(Atom-Bond Electronegativity EqualizationσπModel)模型中,原串行程序求静电相互作用能的方法非常耗时,致使研究问题的效率降低。针对原程序中多个循环相互嵌套的求解部分,采用带状卷帘存储迭代分配的MPI(Message Passing Inter-face)并行化处理;对体系中所有原子、σ键、孤对电子、π键位点之间的静电相互作用能采用多线程CUDA(Computer Unified DeviceArchitecture)并行化处理。传统MPI+CUDA环境中,GPU和CPU之间的数据传输开销大,导致整体性能下降以及各种粒子间计算串行调用CUDA,致使时间浪费。针对上述情况,使用GPU核心的缓存机制解决传输开销大的问题,并利用多CUDA流技术实现多个循环异步进行计算,从而缩短了运行时间。然后选取多个不同类型的大分子体系进行测试,结果表明,利用改进的MPI+CUDA并行模型进行动力学模拟,并行加速比显著提高,大幅度缩减了求解静电相互作用能的时间,并得到与串行一致的结果。
刘青昆马名威杨荣杰宫利东
关键词:并行计算消息传递接口统一计算设备架构
基于信息增益的文本特征选择方法被引量:30
2012年
在类和特征分布不均时,传统信息增益算法的分类性能急剧下降。针对此不足,提出一种基于信息增益的文本特征选择方法(TDpIG)。首先对数据集按类进行特征选择,以减少数据集不平衡性对特征选取的影响。其次运用特征出现概率计算信息增益权值,以降低低频词对特征选择的干扰。最后使用离散度分析特征在每类中的信息增益值,过滤掉高频词中的相对冗余特征,并对选取的特征应用信息增益差值做进一步细化,获取均匀精确的特征子集。通过对比实验表明,选取的特征具有更好的分类性能。
任永功杨荣杰尹明飞马名威
关键词:文本分类不平衡数据集
基于特征权重与词间相关性的文本特征选择算法被引量:3
2012年
传统的ReliefF算法使用二值法不能体现离散特征差异大小,且不能去除冗余特征。针对这种情况提出了mRMR-ReliefF特征选择算法。该算法利用概率弥补特征差异度量上的不足,提出新的差异函数。此函数使提取出的特征更能体现文本的类内相关性和类间差异性。该算法还结合了词间相关性。词间相关性在考虑选择和类别相关性大的特征词的同时还考虑了特征冗余的消除。通过三种算法的对比实验,表明该算法为文本分类提供了更有效的特征子集。
任永功杨荣杰尹明飞
关键词:RELIEFF算法文本分类
基于信息增益特征关联树的文本特征选择算法被引量:9
2013年
传统的信息增益算法在类和特征项分布不均时,分类性能明显下降。针对此不足,提出了一种基于信息增益特征关联树的文本特征选择算法(UDsIG)。首先,对数据集按类进行特征选择,降低类分布不均时对特征选择的影响。其次,利用特征分布均匀度改善特征项在类内分布不均对特征选择的干扰,并采用特征关联树模型对类内特征进行处理,保留强相关特征,删除弱相关和不相关特征,降低特征冗余度。最后,使用类间加权离散度的信息增益公式进一步计算,得到更优特征子集。通过对比实验表明,选取的特征具有更好的分类性能。
任永功杨雪杨荣杰胡志冬
关键词:不平衡数据集离散度
共1页<1>
聚类工具0