您的位置: 专家智库 > >

黄秀丽

作品数:2 被引量:14H指数:2
供职机构:南京师范大学教育科学学院更多>>
发文基金:全国教育科学“十五”规划教育部重点课题江苏省教育科学“十一五”规划课题更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇信息增益
  • 1篇数据集
  • 1篇文本分类
  • 1篇非平衡数据
  • 1篇非平衡数据集
  • 1篇SVM

机构

  • 2篇南京师范大学

作者

  • 2篇王蔚
  • 2篇黄秀丽

传媒

  • 1篇计算机工程与...
  • 1篇计算机技术与...

年份

  • 2篇2009
2 条 记 录,以下是 1-2
排序方式:
SVM在非平衡数据集中的应用被引量:4
2009年
在一个数据集中,至少有一个类别相对与其他类别有很少的样本,则这样数据集可以称为高度倾斜的或者是非平衡的数据集。非平衡数据在现实中普遍存在。在非平衡数据分类中,传统机器学习算法的分类表现受到了阻碍。支持向量机(SVM)基于结构风险最小化原则,是近几年发展起来的机器学习方法。分析了SVM在非平衡数据集中的应用情况,同时提出了几种SVM运用于非平衡数据集中的主要改进方法,这些方法对于非平衡数据的分类有很好的分类效果。
黄秀丽王蔚
一种改进的文本分类特征选择方法被引量:10
2009年
文本分类中特征空间的高维问题是文本分类的主要障碍之一。特征选择(Feature Selection)是一种有效的特征降维方法。现有的特征选择函数主要有文档频率(DF),信息增益(IG),互信息(MI)等。基于特征的基本约束条件以及高性能特征选择方法的设计步骤,提出了一种改进的特征选择方法SIG。该特征选择方法在保证分类效果的同时,提高了对中低频特征的偏向。在语料集Reuters-21578上的实验证明,该方法能够获得较好的分类效果,同时有效提高了对具有强分类能力的中低频特征的利用。
黄秀丽王蔚
关键词:文本分类信息增益
共1页<1>
聚类工具0