您的位置: 专家智库 > >

丁锋

作品数:1 被引量:108H指数:1
供职机构:西藏大学工学院更多>>
发文基金:中央高校基本科研业务费专项资金教育部科学技术研究重点项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本聚类
  • 1篇文本聚类算法
  • 1篇聚类
  • 1篇聚类算法
  • 1篇K-MEAN...
  • 1篇K-MEAN...
  • 1篇K-MEAN...
  • 1篇F

机构

  • 1篇西南交通大学
  • 1篇西藏大学

作者

  • 1篇翟东海
  • 1篇高飞
  • 1篇鱼江
  • 1篇丁锋
  • 1篇于磊

传媒

  • 1篇计算机应用研...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
最大距离法选取初始簇中心的K-means文本聚类算法的研究被引量:108
2014年
由于初始簇中心的随机选择,K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题,提出了最大距离法选取初始簇中心的Kmeans文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类,构造了一种将文本相似度转换为文本距离的方法,同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中,对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析,其结果表明,与原始的K-means聚类算法以及其他的两种改进的K-means聚类算法相比,新提出的文本聚类算法在降低了聚类总耗时的同时,F度量值也有了明显提高。
翟东海鱼江高飞于磊丁锋
关键词:K-MEANS聚类算法文本聚类
共1页<1>
聚类工具0