您的位置: 专家智库 > >

中国博士后科学基金(2012M511303)

作品数:1 被引量:21H指数:1
相关作者:王建马廷淮闫永刚更多>>
相关机构:南京信息工程大学南京大学更多>>
发文基金:中国博士后科学基金江苏省高校优势学科建设工程资助项目江苏省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇HADOOP
  • 1篇KNN分类
  • 1篇KNN分类算...
  • 1篇MAPRED...
  • 1篇MAPRED...
  • 1篇并行计算

机构

  • 1篇南京大学
  • 1篇南京信息工程...

作者

  • 1篇闫永刚
  • 1篇马廷淮
  • 1篇王建

传媒

  • 1篇南京航空航天...

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
KNN分类算法的MapReduce并行化实现被引量:21
2013年
为了提高k-nearest neighbor algorithm(KNN)算法处理大数据集的能力,本文利用Map Reduce并行编程模型,同时结合KNN算法自身的特点,给出了KNN算法在Hadoop平台下的并行化实现。通过设计Map、Combine和Reduce 3个函数,实现了KNN算法的并行化。Map函数完成每个测试样本与训练样本之间的相似度计算,Combine函数作为一个本地的Reduce操作,用以减少中间计算量及通信开销,Reduce函数则根据上述函数得到的中间结果计算出k近邻并作出分类判断。实验结果表明:较之以往的单机版方法,在Hadoop集群上实现的并行化KNN算法具有较好的加速比和良好的扩展性。
闫永刚马廷淮王建
关键词:KNN分类并行计算MAPREDUCE模型HADOOP
共1页<1>
聚类工具0