您的位置: 专家智库 > >

冯小东

作品数:7 被引量:82H指数:3
供职机构:北京科技大学东凌经济管理学院更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术理学自然科学总论更多>>

文献类型

  • 6篇期刊文章
  • 1篇会议论文

领域

  • 4篇自动化与计算...
  • 2篇理学
  • 1篇自然科学总论

主题

  • 4篇聚类
  • 2篇数据划分
  • 2篇排序
  • 2篇维数
  • 2篇相似度
  • 2篇聚类算法
  • 2篇高维
  • 2篇高维数据
  • 2篇并行计算
  • 2篇并行聚类
  • 2篇并行聚类算法
  • 1篇语义相似
  • 1篇语义相似度
  • 1篇云计算
  • 1篇知识服务
  • 1篇容差
  • 1篇数据挖掘
  • 1篇缺失数据
  • 1篇主题发现
  • 1篇文本聚类

机构

  • 7篇北京科技大学
  • 1篇国家信息中心

作者

  • 7篇冯小东
  • 6篇武森
  • 2篇吴庆海
  • 1篇张晓楠
  • 1篇杨杰
  • 1篇郝玫
  • 1篇单志广
  • 1篇王道平
  • 1篇卢丹

传媒

  • 2篇中国科技论文
  • 1篇北京科技大学...
  • 1篇系统工程理论...
  • 1篇计算机学报
  • 1篇计算机应用研...

年份

  • 3篇2014
  • 1篇2012
  • 2篇2011
  • 1篇2010
7 条 记 录,以下是 1-7
排序方式:
基于稀疏指数排序的高维数据并行聚类算法被引量:1
2011年
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的.
武森冯小东吴庆海
关键词:数据划分高维数据聚类并行计算
基于不完备数据聚类的缺失数据填补方法被引量:63
2012年
缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的.
武森冯小东单志广
关键词:不完备数据聚类
基于MapReduce的大规模文本聚类并行化被引量:9
2014年
建立快速有效的针对大规模文本数据的聚类分析方法是当前数据挖掘研究和应用领域中的一个热点问题.为了同时保证聚类效果和提高聚类效率,提出基于"互为最小相似度文本对"搜索的文本聚类算法及分布式并行计算模型.首先利用向量空间模型提出一种文本相似度计算方法;其次,基于"互为最小相似度文本对"搜索选择二分簇中心,提出通过一次划分实现簇质心寻优的二分K-means聚类算法;最后,基于MapReduce框架设计面向云计算应用的大规模文本并行聚类模型.在Hadoop平台上运用真实文本数据的实验表明:提出的聚类算法与原始二分K-means相比,在获得相当聚类效果的同时,具有明显效率优势;并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性.
武森冯小东杨杰张晓楠
关键词:云计算聚类相似度
C4S2-473:基于稀疏指数排序的高维数据并行聚类算法
数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P_CABOSF...
武森冯小东吴庆海
关键词:数据划分高维数据聚类并行计算
基于大规模复杂网络社区发现的科研合著网络分析被引量:3
2014年
针对基于极大团的社区发现算法,设计了适应大规模数据的MapReduce并行计算框架,提出了基于大规模复杂网络社区发现的科研合著网络分析算法,并用于对我国管理科学与工程领域2012年科研合著网络进行社区结构划分。实验结果表明,基于MapReduce的并行社区发现算法可在保证正确性的同时有效提高计算效率,适用于大规模复杂网络的社区发现。针对我国管理科学与工程领域2012年科研合著网络的社区划分结果展现了我国管理科学与工程领域科研合作的特点和问题。
武森卢丹冯小东杜彦南
基于作者引用文献关系的潜在研究兴趣主题发现被引量:4
2014年
扩展LDA(latent dirichlet allocation)模型,提出基于作者引用文献关系的作者-兴趣主题-文献模型。每个作者被分配一个在所有主题上的多项概率分布,每个主题被分配一个在所有文献上的多项概率分布。在DBLP(digital bibliography&library project)文献引用关系数据集上的实验表明,所提模型能有效地提取一个研究领域的主要潜在研究兴趣主题及其所包含的代表性文献,并能挖掘每个作者属于每个研究兴趣主题的分布。
冯小东武森王佳晔
关键词:数据挖掘主题发现LATENTDIRICHLETALLOCATION
基于本体和QoS的面向敏捷供应链知识服务匹配研究被引量:2
2010年
为了加强面向敏捷供应链的知识服务的服务描述信息的机器可理解性,提高用户需求和服务能力之间功能匹配的准确性,在总结和分析相关服务发现和匹配算法的基础上,提出了一个基于扩展OWL-S和服务质量QoS的知识服务描述模型。提出一种基于本体计算语义相似度的方法,利用此方法实现服务的功能性匹配。最后用一个服务匹配实例说明了该匹配算法在充分考虑用户需求方面的有效性。
郝玫王道平冯小东
关键词:敏捷供应链服务质量语义相似度
共1页<1>
聚类工具0