卢丹
- 作品数:3 被引量:17H指数:3
- 供职机构:北京科技大学东凌经济管理学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于大规模复杂网络社区发现的科研合著网络分析被引量:3
- 2014年
- 针对基于极大团的社区发现算法,设计了适应大规模数据的MapReduce并行计算框架,提出了基于大规模复杂网络社区发现的科研合著网络分析算法,并用于对我国管理科学与工程领域2012年科研合著网络进行社区结构划分。实验结果表明,基于MapReduce的并行社区发现算法可在保证正确性的同时有效提高计算效率,适用于大规模复杂网络的社区发现。针对我国管理科学与工程领域2012年科研合著网络的社区划分结果展现了我国管理科学与工程领域科研合作的特点和问题。
- 武森卢丹冯小东杜彦南
- 电子商务中基于复杂网络社团发现的商品推荐研究被引量:3
- 2015年
- 本文针对电子商务中的商品推荐问题,利用交易数据构建基于商品的复杂网络,提出一种基于复杂网络社团发现的商品推荐方法,并且应用数据集进行了实验分析。结果表明,本方法在某用户只有较少历史行为数据时,仍可对该用户进行推荐,而且推荐结果可以保证新颖度和覆盖度。另外,此方法可处理的数据规模适用于电子商务的商品推荐,并且计算复杂度较低。
- 卢丹王君博武森
- 关键词:电子商务复杂网络社团发现
- 基于聚类欠采样的集成不均衡数据分类算法被引量:11
- 2017年
- 传统的分类算法大多假设数据集是均衡的,追求整体的分类精度.而实际数据集经常是不均衡的,因此传统的分类算法在处理实际数据集时容易导致少数类样本有较高的分类错误率.现有针对不均衡数据集改进的分类方法主要有两类:一类是进行数据层面的改进,用过采样或欠采样的方法增加少数类数据或减少多数类数据;另一个是进行算法层面的改进.本文在原有的基于聚类的欠采样方法和集成学习方法的基础上,采用两种方法相结合的思想,对不均衡数据进行分类.即先在数据处理阶段采用基于聚类的欠采样方法形成均衡数据集,然后用AdaBoost集成算法对新的数据集进行分类训练,并在算法集成过程中引用权重来区分少数类数据和多数类数据对计算集成学习错误率的贡献,进而使算法更关注少数数据类,提高少数类数据的分类精度.
- 武森刘露卢丹
- 关键词:不均衡数据欠采样聚类