您的位置: 专家智库 > >

苏冲

作品数:2 被引量:7H指数:2
供职机构:哈尔滨工业大学深圳研究生院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇引擎
  • 2篇搜索
  • 2篇搜索引擎
  • 2篇索引
  • 2篇频繁项
  • 2篇频繁项集
  • 2篇最大频繁项集
  • 2篇项集
  • 2篇聚类
  • 2篇查询
  • 2篇查询结果
  • 1篇信息处理
  • 1篇在线聚类
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇网页
  • 1篇网页聚类
  • 1篇聚类方法
  • 1篇类方

机构

  • 2篇哈尔滨工业大...

作者

  • 2篇苏冲
  • 1篇王晓龙
  • 1篇陈清才
  • 1篇孟宪军

传媒

  • 1篇中文信息学报

年份

  • 1篇2010
  • 1篇2009
2 条 记 录,以下是 1-2
排序方式:
基于最大频繁项集的搜索引擎查询结果聚类方法
随着网络信息的爆炸式增长,如何帮助用户快速准确地定位所需信息就成了一个十分紧要的问题。通过对搜索引擎查询结果进行在线聚类可以解决这个问题。然而由于查询结果在线聚类所具有实时性,标签可读性等特点,传统的聚类算法无法满足应用...
苏冲
关键词:最大频繁项集搜索引擎查询结果在线聚类
文献传递
基于最大频繁项集的搜索引擎查询结果聚类算法被引量:5
2010年
现有的搜索引擎查询结果聚类算法大多针对用户查询生成的网页摘要进行聚类,由于网页摘要篇幅较短,质量良莠不齐,聚类效果难以有较大的提高(比如后缀树算法,Lingo算法);而传统的基于全文的聚类算法运算复杂度较高,且难以生成高质量的类别标签,无法满足在线聚类的需求(比如KMeans算法)。该文提出一种基于全文最大频繁项集的网页在线聚类算法MFIC(Maximal Frequent Itemset Clustering)。算法首先基于全文挖掘最大频繁项集,然后依据网页集合之间最大频繁项集的共享关系进行聚类,最后依据类别包含的频繁项生成类别标签。实验结果表明MFIC算法降低了基于网页全文聚类的时间,聚类精度提高15%左右,且能生成可读性较好的类别标签。
苏冲陈清才王晓龙孟宪军
关键词:中文信息处理搜索引擎网页聚类频繁项集
共1页<1>
聚类工具0