您的位置: 专家智库 > >

刘露

作品数:1 被引量:11H指数:1
供职机构:北京科技大学东凌经济管理学院更多>>
发文基金:国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇欠采样
  • 1篇聚类
  • 1篇不均衡数据
  • 1篇采样

机构

  • 1篇北京科技大学

作者

  • 1篇武森
  • 1篇卢丹
  • 1篇刘露

传媒

  • 1篇工程科学学报

年份

  • 1篇2017
1 条 记 录,以下是 1-1
排序方式:
基于聚类欠采样的集成不均衡数据分类算法被引量:11
2017年
传统的分类算法大多假设数据集是均衡的,追求整体的分类精度.而实际数据集经常是不均衡的,因此传统的分类算法在处理实际数据集时容易导致少数类样本有较高的分类错误率.现有针对不均衡数据集改进的分类方法主要有两类:一类是进行数据层面的改进,用过采样或欠采样的方法增加少数类数据或减少多数类数据;另一个是进行算法层面的改进.本文在原有的基于聚类的欠采样方法和集成学习方法的基础上,采用两种方法相结合的思想,对不均衡数据进行分类.即先在数据处理阶段采用基于聚类的欠采样方法形成均衡数据集,然后用AdaBoost集成算法对新的数据集进行分类训练,并在算法集成过程中引用权重来区分少数类数据和多数类数据对计算集成学习错误率的贡献,进而使算法更关注少数数据类,提高少数类数据的分类精度.
武森刘露卢丹
关键词:不均衡数据欠采样聚类
共1页<1>
聚类工具0