您的位置: 专家智库 > >

孟宪军

作品数:1 被引量:5H指数:1
供职机构:哈尔滨工业大学深圳研究生院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息处理
  • 1篇引擎
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇频繁项
  • 1篇频繁项集
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇最大频繁项集
  • 1篇网页
  • 1篇网页聚类
  • 1篇项集
  • 1篇聚类
  • 1篇查询
  • 1篇查询结果

机构

  • 1篇哈尔滨工业大...

作者

  • 1篇苏冲
  • 1篇王晓龙
  • 1篇陈清才
  • 1篇孟宪军

传媒

  • 1篇中文信息学报

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
基于最大频繁项集的搜索引擎查询结果聚类算法被引量:5
2010年
现有的搜索引擎查询结果聚类算法大多针对用户查询生成的网页摘要进行聚类,由于网页摘要篇幅较短,质量良莠不齐,聚类效果难以有较大的提高(比如后缀树算法,Lingo算法);而传统的基于全文的聚类算法运算复杂度较高,且难以生成高质量的类别标签,无法满足在线聚类的需求(比如KMeans算法)。该文提出一种基于全文最大频繁项集的网页在线聚类算法MFIC(Maximal Frequent Itemset Clustering)。算法首先基于全文挖掘最大频繁项集,然后依据网页集合之间最大频繁项集的共享关系进行聚类,最后依据类别包含的频繁项生成类别标签。实验结果表明MFIC算法降低了基于网页全文聚类的时间,聚类精度提高15%左右,且能生成可读性较好的类别标签。
苏冲陈清才王晓龙孟宪军
关键词:中文信息处理搜索引擎网页聚类频繁项集
共1页<1>
聚类工具0