您的位置: 专家智库 > >

佛山市产学研专项基金(2012HC100272)

作品数:4 被引量:10H指数:2
相关作者:胡小生钟勇张润晶更多>>
相关机构:佛山科学技术学院更多>>
发文基金:佛山市科技发展专项基金佛山市产学研专项基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 3篇不平衡数据
  • 2篇数据分类
  • 2篇聚类
  • 2篇不平衡数据分...
  • 1篇堆叠
  • 1篇元学
  • 1篇元学习
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇树相
  • 1篇数据挖掘
  • 1篇数据挖掘算法
  • 1篇随机子空间
  • 1篇子空间
  • 1篇向量
  • 1篇向量机
  • 1篇聚类分析
  • 1篇决策树
  • 1篇均值聚类
  • 1篇加权

机构

  • 4篇佛山科学技术...

作者

  • 4篇胡小生
  • 3篇钟勇
  • 2篇张润晶

传媒

  • 1篇佛山科学技术...
  • 1篇计算机与数字...
  • 1篇计算机科学
  • 1篇智能系统学报

年份

  • 4篇2013
4 条 记 录,以下是 1-4
排序方式:
基于加权聚类质心的SVM不平衡分类方法被引量:4
2013年
不平衡数据分类是机器学习研究的热点问题,传统分类算法假定不同类别具有平衡分布或误分代价相同,难以得到理想的分类结果.提出一种基于加权聚类质心的SVM分类方法,在正负类样本上分别进行聚类,对每个聚类,用聚类质心和权重因子代表聚类内样本分布和数量,相等类别数量的质心和权重因子参与SVM模型训练.实验结果表明,该方法使模型的训练样本具有较高的代表性,分类性能与其他采样方法相比得到了提升.
胡小生钟勇
关键词:不平衡数据分类支持向量机
改进随机子空间与决策树相结合的不平衡数据分类方法
2013年
提出一种改进随机子空间与C4.5决策树算法相结合的分类算法。以C4.5算法构建决策树作为集成学习的基分类器,每次迭代初始,将SMOTE采样技术与随机子空间方法相结合,生成在特征空间和数据分布上差异明显的合成样例,为基分类器提供多样化的平衡训练数据集,采用绝大多数投票方法进行最终决策的融合输出。实验结果表明,该方法对少数类和多数类均具有较高的识别率。
胡小生
关键词:不平衡数据分类决策树
两层聚类的类别不平衡数据挖掘算法被引量:6
2013年
类别不平衡数据分类是机器学习和数据挖掘研究的热点问题。传统分类算法有很大的偏向性,少数类分类效果不够理想。提出一种两层聚类的类别不平衡数据级联挖掘算法。算法首先进行基于聚类的欠采样,在多数类样本上进行聚类,之后提取聚类质心,获得与少数类样本数目相一致的聚类质心,再与所有少数类样例一起组成新的平衡训练集,为了避免少数类样本数量过少而使训练集过小导致分类精度下降的问题,使用SMOTE过采样结合聚类欠采样;然后在平衡的训练集上使用K均值聚类与C4.5决策树算法相级联的分类方法,通过K均值聚类将训练样例划分为K个簇,在每个聚类簇内使用C4.5算法构建决策树,通过K个聚簇上的决策树来改进优化分类决策边界。实验结果表明,该算法具有处理类别不平衡数据分类问题的优势。
胡小生张润晶钟勇
关键词:数据挖掘不平衡数据K均值聚类
基于聚类分析的改进堆叠算法被引量:1
2013年
在基于Stacking框架下异构分类器集成的元学习基础上,将无监督的聚类应用到分类过程中,提出一种基于聚类分析的改进Stacking集成算法。训练样本首先被基分类器分类,随后分类结果被聚类成多个簇,以便分类结果相一致的样本能够被聚集至同一个簇中,同时,将样本特征属性也应用到聚类过程中以增强聚类效果,在每个聚簇内应用C4.5决策树算法提炼决策边界;在分类阶段,首先找出与待分类样本距离最近的聚簇,之后用此聚簇的决策树模型进行分类。实验结果表明,该算法在分类准确性方面有明显优势。
胡小生张润晶钟勇
关键词:分类器集成STACKING聚类元学习
共1页<1>
聚类工具0