公共文化服务平台

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

基于最大频繁项集的搜索引擎查询结果聚类方法: 随着网络信息的爆炸式增长，如何帮助用户快速准确地定位所需信息就成了一个十分紧要的问题。通过对搜索引擎查询结果进行在线聚类可以解决这个问题。然而由于查询结果在线聚类所具有实时性，标签可读性等特点，传统的聚类算法无法满足应用...; 苏冲; 关键词：最大频繁项集搜索引擎查询结果在线聚类; 文献传递

基于最大频繁项集的搜索引擎查询结果聚类算法被引量：5: 2010年; 现有的搜索引擎查询结果聚类算法大多针对用户查询生成的网页摘要进行聚类,由于网页摘要篇幅较短,质量良莠不齐,聚类效果难以有较大的提高(比如后缀树算法,Lingo算法);而传统的基于全文的聚类算法运算复杂度较高,且难以生成高质量的类别标签,无法满足在线聚类的需求(比如KMeans算法)。该文提出一种基于全文最大频繁项集的网页在线聚类算法MFIC(Maximal Frequent Itemset Clustering)。算法首先基于全文挖掘最大频繁项集,然后依据网页集合之间最大频繁项集的共享关系进行聚类,最后依据类别包含的频繁项生成类别标签。实验结果表明MFIC算法降低了基于网页全文聚类的时间,聚类精度提高15%左右,且能生成可读性较好的类别标签。; 苏冲陈清才王晓龙孟宪军; 关键词：中文信息处理搜索引擎网页聚类频繁项集

全选清除导出

共1页<1>

苏冲