秦皇岛市科学技术研究与发展计划课题(201001A018)
- 作品数:5 被引量:5H指数:2
- 相关作者:刘佳新严书亭任家东贺春亮更多>>
- 相关机构:燕山大学更多>>
- 发文基金:秦皇岛市科学技术研究与发展计划课题国家自然科学基金河北省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于序列树的增量式序列模式更新算法被引量:1
- 2011年
- 在序列数据库更新时,现有的增量式序列模式挖掘算法只提到序列的插入操作和序列的扩展操作两种情况,没有针对序列删除操作。提出了一种基于序列树的增量式序列模式更新算法(ISPST)。当数据库更新时,ISPST算法只需要对与删除序列有关的序列构造投影数据库,实现对序列树的更新操作,通过深度优先遍历序列树得到更新后数据库中的所有序列模式。实验结果表明,当支持度发生变化时,ISPST算法在时间性能上优于PrefixSpan算法和IncSpan算法。
- 刘佳新严书亭贺春亮任家东
- 关键词:增量式挖掘投影数据库
- 基于频繁序列树的交互式序列模式挖掘算法被引量:1
- 2012年
- 为了减少在序列模式挖掘过程中由于重复运行挖掘算法而产生的时空消耗,提出了一种基于频繁序列树的交互式序列模式挖掘算法(ISPM)。ISPM算法采用频繁序列树作为序列存储结构,频繁序列树中存储数据库中满足频繁序列树支持度阈值的所有序列模式及其支持度信息。当支持度发生变化时,通过减少本次挖掘所要构造投影数据库的频繁项的数量来缩减投影数据库的规模,从而减少时空消耗。实验结果表明,ISPM算法在时间性能上优于PrefixSpan算法和Inc-Span算法。
- 刘佳新
- 关键词:数据挖掘
- 一种基于频繁序列树的增量式序列模式挖掘算法被引量:1
- 2012年
- 针对目前现有的增量式序列模式挖掘算法没有充分利用先前的挖掘结果,当数据库更新时,需要对数据库进行重复挖掘的问题。本文提出一种基于频繁序列树的增量式序列模式挖掘算法(ISFST),ISFST采用频繁序列树作为序列存储结构,当数据库发生变化时,ISFST算法分两种情况对频繁序列树进行更新操作,通过遍历频繁序列树得到满足最小支持度的所有序列模式。实验结果表明,ISFST算法在时间性能上优于PrefixSpan算法和IncSpan算法。
- 刘佳新
- 关键词:数据挖掘增量式挖掘投影数据库剪枝策略
- 一种高效的增量式序列模式挖掘算法被引量:3
- 2012年
- 现有的增量式挖掘算法在支持度发生变化时,需要对序列数据库进行重复挖掘,为减少由此产生的时空消耗,提出一种高效的增量式序列模式挖掘算法。算法采用频繁序列树作为序列存储结构,当序列数据库和最小支持度发生变化时,通过执行更新操作,实现频繁序列树的更新,利用深度优先遍历频繁序列树找到序列数据库中所有的序列模式。实验结果表明,与IncSpan算法和PrefixSpan算法相比,该算法的挖掘效率较高。
- 刘佳新
- 关键词:数据挖掘增量式挖掘投影数据库
- 缩减投影数据库规模的增量式序列模式算法被引量:2
- 2012年
- 在增量式序列模式挖掘算法中,数据库更新只有插入和扩展2种操作,未考虑序列删除的情况。为此,提出一种基于频繁序列树的增量式序列模式更新算法(IUFST)。在数据库和支持度发生变化时,IUFST算法分不同情况对频繁序列树进行更新操作,缩减投影数据库的规模,提高算法效率。实验结果表明,该算法在时间性能上优于PrefixSpan算法和IncSpan算法。
- 刘佳新严书亭任家东
- 关键词:数据挖掘增量式挖掘投影数据库