叶红云
- 作品数:9 被引量:28H指数:4
- 供职机构:合肥工业大学管理学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划安徽省教育厅科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种混合型集成学习演化决策树算法
- 决策树是一种使用树型结构模型对未知数据进行预测的分类方法。但传统算法一般采用局部最优搜索策略进行决策树构造,其主要缺点在于容易陷入局部最优。为解决该问题,近年来,研究者将演化算法与决策树方法相结合,以利用演化算法全局搜索...
- 叶红云倪志伟陈恩红
- 关键词:决策树
- 文献传递
- 基于分形维数的数据挖掘技术研究综述被引量:9
- 2008年
- 分形维数在数据挖掘领域起着非常特殊的作用,它能有效地描述数据集,能反映复杂数据集中隐藏的规律性,基于分形维数的数据挖掘技术研究越来越受到人们的广泛关注。本文首先介绍了数据集的分形维数,进而在此基础上重点介绍了几种基于分形维数的数据挖掘技术,并对每种技术的特点进行了阐述,最后指出今后的发展方向。
- 倪丽萍倪志伟吴昊叶红云
- 关键词:分形分形维数数据挖掘
- 面向金融营销问题的个性化推荐方法研究
- 金融营销受到金融企业的高度关注。随着金融领域信息化技术应用的飞速发展,包括网上银行业务的开展,以及数据仓库等技术的应用,如何应用包括个性化推荐在内的数据挖掘技术解决金融营销问题,已成为当前的一个研究热点。
金融营...
- 叶红云
- 关键词:金融营销客户细分个性化推荐兴趣漂移序列模式挖掘
- 文献传递
- 基于分形维数和蚁群算法的属性选择方法被引量:6
- 2009年
- 属性选择在机器学习和数据挖掘领域起着重要作用,通常作为一个主要的预处理步骤.本文提出一种利用分形维数和蚁群算法进行属性选择的方法.在该方法中分形维数作为属性选择的评价机制,利用蚁群算法的正反馈机制加速属性选择的过程.为了分析结果的有效性,利用SVM分类算法和K-fold交叉验证相结合的方法对4个数据集属性选择前后的分类性能进行测试.实验结果表明该方法具有较好的性能,它能在较短的时间里找到较优的属性子集,并大大降低了数据集的维数.
- 倪丽萍倪志伟吴昊叶红云
- 关键词:分形维数蚁群算法
- 一种检测兴趣漂移的图结构推荐系统被引量:7
- 2012年
- 协同过滤是构造推荐系统最有效的方法之一.其中,基于图结构推荐方法成为近来协同过滤的研究热点.基于图结构的方法视用户和项为图的结点,并利用图理论去计算用户和项之间的相似度.尽管人们对图结构推荐系统开展了很多的研究和应用,然而这些研究都认为用户的兴趣是保持不变的,所以不能够根据用户兴趣的相关变化做出合理推荐.本文提出一种新的可以检测用户兴趣漂移的图结构推荐系统.首先,设计了一个新的兴趣漂移检测方法,它可以有效地检测出用户兴趣在何时发生了哪种变化.其次,根据用户的兴趣序列,对评分项进行加权并构造用户特征向量.最后,整合二部投影与随机游走进行项推荐.在标准数据集MovieLens上的测试表明算法优于两个图结构推荐方法和一个评分时间加权的协同过滤方法.
- 叶红云倪志伟倪丽萍
- 关键词:随机游走
- 一种混合型集成学习演化决策树算法
- 决策树是一种使用树型结构模型对未知数据进行预测的分类方法。但传统算法一般采用局部最优搜索策略进行决策树构造,其主要缺点在于容易陷入局部最优。为解决该问题,近年来,研究者将演化算法与决策树方法相结合,以利用演化算法全局搜索...
- 叶红云倪志伟陈恩红
- 关键词:决策树
- 基于案例库维护的案例推理分类技术被引量:4
- 2007年
- 分类是数据处理和数据挖掘的重要任务之一,文章在建立案例推理分类器之前,先利用相似粗糙集进行案例属性的约简,再利用基于案例分类的删除技术进行案例库的维护操作;不仅减少案例的存储空间,也大大提高分类的精确度;实验结果表明,相比传统的案例推理分类器和神经网络分类器,该分类器在分类精度和速度上都有一定的优势。
- 倪志伟倪丽萍叶红云吴昊
- 关键词:属性约简案例库维护
- 基于ACV约束的序列模式挖掘算法
- 2010年
- 针对变值数据环境下的序列模式挖掘问题进行研究,提出一种针对变值数据的约束(ACV约束),用于表达用户在变值数据环境下对序列模式聚集特征的要求.在此基础上,提出一种基于ACV约束的序列模式挖掘算法,利用ACV约束的性质有效削减搜索空间.在用IBM数据生成器产生的序列数据以及真实数据上的实验结果表明,该算法能够有效利用ACV约束对无用的候选序列模式进行剪枝,减少冗余的搜索空间并提高挖掘效率.
- 叶红云倪志伟倪丽萍
- 关键词:投影数据库
- 基于均值约束满足度剪枝策略的高效序列模式挖掘算法被引量:1
- 2007年
- 为了减少无用候选序列的生成,并使挖掘得到的序列模式符合用户要求,约束条件下的频繁序列模式挖掘已成为数据挖掘领域的一个新的重要研究方向.作为强约束形式的一种,均值约束目前仍然是基于约束的频繁序列模式挖掘的一个困难问题,其主要原因在于很难利用均值约束来进行序列模式挖掘中的剪枝.为此,提出了一种基于均值约束满足度剪枝策略,并且以前缀增长方法为基础设计了一个有效的频繁序列模式挖掘算法.通过分析并实验验证了该算法的时间效率和剪枝性能,结果表明,该方法是有效的.
- 倪志伟叶红云曹欢欢
- 关键词:剪枝