您的位置: 专家智库 > >

董家鸣

作品数:1 被引量:2H指数:1
供职机构:北京大学地球与空间科学学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇子空间
  • 1篇子空间聚类
  • 1篇维数
  • 1篇聚类
  • 1篇聚类算法
  • 1篇空间聚类
  • 1篇高维
  • 1篇高维数据
  • 1篇MAPRED...
  • 1篇并行聚类

机构

  • 1篇北京大学

作者

  • 1篇潘懋
  • 1篇董家鸣
  • 1篇张驰

传媒

  • 1篇科学技术与工...

年份

  • 1篇2017
1 条 记 录,以下是 1-1
排序方式:
基于MapReduce的并行子空间聚类算法被引量:2
2017年
随着现有数据体量的迅速增长,超大规模中高维数据集的聚类问题变得越来越重要;而现有的子空间聚类算法大多是单机串行执行,处理此类问题效率极低。讨论了利用MapReduce对这类数据集进行并行聚类的方法,提出了基于MapReduce的抽样-忽略子空间聚类算法(sample-ignore subspace clustering using MapReduce,SISCMR)。该算法将串行聚类算法用作插件,具有很好的通用性。在人造和真实数据集上进行了大量实验,其中最大为0.2 TB的数据集在128个核心的集群中仅用不到10 min就完成了聚类,验证了该算法良好的聚类质量、近线性的可扩展性和高效的聚类性能,证明了基于MapReduce的并行聚类的可行性。
董家鸣潘懋张驰
关键词:子空间聚类并行聚类MAPREDUCE高维数据
共1页<1>
聚类工具0