河北省教育厅高等学校自然科学研究项目(Z2009407)
- 作品数:2 被引量:4H指数:1
- 相关作者:丰继林李军李鑫高方平李忠更多>>
- 相关机构:防灾科技学院更多>>
- 发文基金:中国地震局教师科研基金河北省教育厅高等学校自然科学研究项目国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于聚类的异常检测方法被引量:3
- 2011年
- 利用数据挖掘技术对网络中的海量数据进行分析从而发现入侵行为已成为目前异常检测研究的重点。为了进一步提高入侵行为检测的质量,提出了一种改进的异常检测算法。该方法首先将训练数据集转换为标准的单位特征度量空间,然后利用改进算法对数据进行划分,以找到聚类中心。最后对改进算法进行了性能分析与比较,实验结果表明:算法具有良好的稳定性,能够有效地检测真实网络数据中的入侵行为,对大数据集合具有较好的可伸缩性。
- 李鑫单维峰丰继林李军高方平李忠
- 关键词:数据挖掘聚类异常检测检测率误警率
- 面向相似重复记录检测的特征优选方法被引量:1
- 2011年
- 大数据集相似重复记录检测和识别中,数据源组成复杂、表征数据记录的特征属性过多,因而检测精度不高、执行检测的代价过大。针对这些问题,提出了一种分组模糊聚类的特征优选方法。首先进行分组记录的属性处理,以有效降低记录属性的维数,并获得分组中的代表性记录,然后采用一种相似度比较计算方法进行组内相似重复记录的检测。理论分析和实验表明:该方法有较高的识别精度和检测效率,能较好地解决大数据集中相似重复记录的识别问题。
- 李鑫李军丰继林高方平李忠
- 关键词:相似重复记录模糊聚类相似度