您的位置: 专家智库 > >

孙春红

作品数:2 被引量:1H指数:1
供职机构:南京师范大学数学与计算机科学学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇文档
  • 2篇WEB文档
  • 1篇信息处理
  • 1篇文档聚类
  • 1篇文档聚类算法
  • 1篇聚类
  • 1篇聚类算法
  • 1篇分布信息
  • 1篇VSM
  • 1篇WEB挖掘
  • 1篇WEB挖掘技...
  • 1篇WEB文档聚...

机构

  • 2篇南京师范大学

作者

  • 2篇孙春红
  • 1篇杨明

传媒

  • 1篇南京师范大学...

年份

  • 2篇2008
2 条 记 录,以下是 1-2
排序方式:
嵌入分布信息的Web文档聚类算法研究
随着Intemet的迅速发展,Web信息资源己涵盖了社会生活的各个方面。网络信息过载问题日益突出,这促使Web挖掘技术迅速发展。本文从Web文档聚类的角度,围绕文档分布信息表示及其相似性度量方法、多角度聚类及核理论在多角...
孙春红
关键词:WEB挖掘技术文档聚类算法信息处理
文献传递
一种嵌入分布信息的Web文档相似性度量被引量:1
2008年
Web文档间的相似性度量是Web文本分类的关键,有效的相似性度量策略可改进Web文本分类的精度.经典的向量空间模型(VSM)仅考虑网页中单词的出现频率,未有效利用单词的分布信息,因而影响了网页的分类精度.论文计算了网页中单词分布位置的均值和方差,并将之引入到网页的相似性计算中,提出了一种直接嵌入分布信息的新的网页相似性度量方法.该方法因合理利用单词的出现频率及其分布信息,可有效改进和拓展经典的网页相似性度量策略.实验结果表明,该网页相似性度量方法是有效可行的.
孙春红杨明
关键词:VSM分布信息
共1页<1>
聚类工具0