您的位置: 专家智库 > >

马菁

作品数:2 被引量:18H指数:2
供职机构:辽宁工程技术大学软件学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇数据挖掘
  • 1篇谱聚类
  • 1篇谱聚类算法
  • 1篇聚类
  • 1篇聚类算法
  • 1篇关联规则
  • 1篇关联规则挖掘
  • 1篇关联规则挖掘...
  • 1篇规则挖掘算法
  • 1篇HADOOP...
  • 1篇大数据
  • 1篇M
  • 1篇MAP

机构

  • 2篇辽宁工程技术...

作者

  • 2篇马菁
  • 1篇王英博
  • 1篇赵彬

传媒

  • 1篇计算机工程
  • 1篇计算机应用研...

年份

  • 1篇2018
  • 1篇2016
2 条 记 录,以下是 1-2
排序方式:
基于Hadoop平台的改进关联规则挖掘算法被引量:15
2016年
数据采集方式的增多导致单处理器下的关联规则挖掘受到I/O和内存的限制。针对该问题,对传统挖掘算法进行改进。借助Hadoop平台的优势,通过累加迭代的方法降低算法的时间复杂度,并利用MapReduce编程特点,通过一次遍历和MapReduce任务调度完成频繁项集挖掘,在强关联挖掘中通过Sqoop组件将外部表Hive中的数据迁移到Redis,实现数据的高速读取。实验结果表明,该方法可有效提高挖掘效率,提高幅度随数据集规模同步增大,并且具有较好的加速比和扩展性。
王英博马菁柴佳佳赵彬
关键词:HADOOP平台关联规则大数据数据挖掘
基于最优投影的半监督谱聚类算法被引量:3
2018年
针对谱聚类算法在解决高维、大数据量的聚类问题时出现的效率不高和准确率明显下降的问题进行了研究,并在此研究基础上结合最优投影理论和Nystr9m抽样提出了基于最优投影的半监督谱聚类算法(semi-supervised spectral clustering based on the optimal projection,SSOP)。该算法从高内聚低耦合的聚类目标出发,根据少量的监督信息计算类内以及类间离散度求得最优投影方向,从而区分各属性的重要程度,在此基础上使用了Nystr9m抽样来降低特征分解时间复杂度以达到在提高聚类算法准确率的基础上提高算法的效率。实验结果表明,该方法能够有效地提高聚类的准确率和效率。
王英博马菁宋晓倩
关键词:谱聚类
共1页<1>
聚类工具0