河北省博士后基金(B200322)
- 作品数:3 被引量:2H指数:1
- 相关作者:任家东宗俊省周晓磊龚冰更多>>
- 相关机构:燕山大学更多>>
- 发文基金:河北省博士后基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于规则表达式约束的序列模式增量式挖掘算法被引量:1
- 2007年
- 序列模式挖掘是数据挖掘中的研究热点之一。在挖掘过程中需要用户的参与日益显得重要。为了提高挖掘过程中的交互性,本文提出了一个基于规则表达式约束的序列模式增量式挖掘算法RE_IncUp。该算法首先利用约束对已经挖掘出的频繁序列模式进行预处理,缩小了搜索范围;然后采用模式扩展方法把规则表达式约束和增量挖掘过程融为一体,并且采用先修剪后计算支持度的方法进一步缩小了搜索范围,降低了支持度的计算量。该算法允许用户不断改变约束条件,实现交互式挖掘而且可将挖掘的目标仅仅聚焦到用户感兴趣的模式上。实验表明该算法对序列模式的维护和满足用户的需求都是十分有效的。
- 任家东宗俊省
- 关键词:数据挖掘增量式挖掘
- 一种挖掘序列模式的增量式更新算法被引量:1
- 2007年
- 讨论了当从序列数据库中删除某些信息时,序列模式的更新维护问题。提出了一种新的算法MA_D (Maintaining Algorithm while Deleting information),处理因数据库更新而引起的序列模式的维护问题。该算法充分利用在前次模式挖掘过程中得到的信息,降低了挖掘新的序列模式的开销。实验分析表明,该算法对于序列模式的维护是十分有效的。
- 任家东周晓磊
- 关键词:数据挖掘增量式更新
- 双时态周期数据模型的研究
- 2006年
- 在经典的时态数据模型HMAP的基础上,通过增加事务时间参数delay的方式,提出了一种支持多时间粒度,可以有效处理具有周期特性数据的双时态数据模型PMB,该数据模型可以有效地解决HMAP模型存储中记录条目繁多和时间交叉的问题,从而节约存储空间,提高数据的查询速度。理论分析和实验结果表明PMB数据模型可以把需要存储为n条记录的数据简化为有限的几条,而且当n值很大,甚至无穷的时候,这种存储方式具有明显的优势。
- 任家东龚冰