广西大学科研基金(XJZ100258)
- 作品数:2 被引量:9H指数:2
- 相关作者:梁斌梅韦琳娜宋庆祯更多>>
- 相关机构:广西大学四川大学更多>>
- 发文基金:广西大学科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于层次聚类的全局孤立点识别方法被引量:4
- 2011年
- 针对现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,提出了一种快速有效的基于层次聚类的全局孤立点检测方法。该方法基于层次聚类的结果,根据聚类树和距离矩阵可视化判断数据孤立程度,并确定孤立点数目。从聚类树自顶向下,无监督地去除孤立点。仿真实验验证了本方法能快速有效识别全局孤立点,具有用户友好性,适用于不同形状的数据集,可用于大型高维数据集的孤立点检测。
- 梁斌梅韦琳娜宋庆祯
- 关键词:孤立点检测层次聚类数据挖掘
- 基于层次聚类识别数据集前n个全局孤立点被引量:5
- 2012年
- 孤立数据的存在使数据挖掘结果不准确,甚至错误。现有的孤立点检测算法在通用性、有效性、用户友好性及处理高维大数据集的性能还不完善,为此,提出一种有效的全局孤立点检测方法,该方法进行凝聚层次聚类,根据聚类树和距离矩阵来可视化判断数据孤立程度,确定孤立点数目。从聚类树自顶向下,无监督地去除离群数据点。在多个数据集上的仿真实验结果表明,该方法能有效识别孤立程度最大的前n个全局孤立点,适用于不同形状的数据集,算法效率高,用户友好,且适用于大型高维数据集的孤立点检测。
- 梁斌梅
- 关键词:孤立点检测层次聚类数据挖掘