您的位置: 专家智库 > >

刘驰

作品数:1 被引量:0H指数:0
供职机构:北京大学信息科学技术学院网络与信息系统研究所更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇引擎
  • 1篇元信息
  • 1篇搜索
  • 1篇搜索引擎
  • 1篇索引
  • 1篇去重

机构

  • 1篇北京大学

作者

  • 1篇闫宏飞
  • 1篇刘驰

传媒

  • 1篇山东大学学报...

年份

  • 1篇2016
1 条 记 录,以下是 1-1
排序方式:
基于元信息的云盘资源检索结果去重
2016年
区别于传统计算网页文本相似度的去重方法,以多媒体数据文件为主的云盘资源仅可利用相当有限的元信息进行检索结果去重。针对这一问题,以搭建的面向云盘资源数据的搜索引擎系统为基础,通过对云盘资源元信息特性的分析,发现除名称之外,资源文件后缀名、占用空间大小、资源的用户归属是判定重复记录的有效特征。在此基础上,给出了处理上述特征的归一化方法,进而使用无监督方法进行去重。实验结果表明,该方法能够有效对云盘资源检索结果去重。
刘驰闫宏飞
关键词:搜索引擎去重元信息
共1页<1>
聚类工具0