李梅花
- 作品数:3 被引量:9H指数:2
- 供职机构:郑州大学信息工程学院更多>>
- 发文基金:河南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一个高效的关联规则挖掘算法被引量:2
- 2006年
- 运用抽样和动态项集计数的思想,提出了一个仅对数据库进行一遍扫描的关联规则挖掘算法DS。DS首先在数据库上随机得到一个样本集,然后在样本集上使用动态项集计数方法得到数据库的估计频繁项,之后通过对数据库中的非样本事务进行一遍扫描得到这些项的实际计数,进而得到数据库的频繁项集。实验证明,DS算法极大地提高了挖掘的效率。
- 柴玉梅李梅花
- 关键词:关联规则
- 基于抽样的分布式关联规则挖掘算法
- 数据挖掘是指从巨量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,其目的就是要从大量数据中找出有意义的模式,因此具有广泛的应用价值。在数据挖掘的研究中,如何高效的发现满足用户要求的关联规则已经成为一个...
- 李梅花
- 关键词:分布式关联规则挖掘元学习相似度概念格
- 文献传递
- 利用抽样技术和元学习的分布式关联规则挖掘算法被引量:7
- 2006年
- 结合动态项集计数技术和抽样的思想,利用元学习策略来产生频繁项集,提出了一个不共享内存的分布式关联规则挖掘算法DASM;引进了相似度的概念,并用之提高了挖掘的精确度。理论分析以及在IBM数据生成器生成的数据集上的实验均表明,DASM算法具有较高的挖掘效率和较低的通信量,适用于对效率要求较高的应用领域。
- 李梅花王黎明许红涛
- 关键词:元学习相似度分布式关联规则挖掘