您的位置: 专家智库 > >

中央高校基本科研业务费专项资金(10XN1018)

作品数:1 被引量:7H指数:1
相关作者:杜小勇徐天任荣垂田更多>>
相关机构:中国人民大学教育部更多>>
发文基金:中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇分块

机构

  • 1篇教育部
  • 1篇中国人民大学

作者

  • 1篇荣垂田
  • 1篇徐天任
  • 1篇杜小勇

传媒

  • 1篇计算机研究与...

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
基于划分的集合相似连接被引量:7
2012年
集合相似连接(set similarity join)是指在给定的数据集中,按照基于集合间覆盖关系的相似度计算方法来衡量数据之间的相似度、并找出所有相似度不小于给定阈值的数据对的操作.集合相似连接作为一种新的基本操作在很多领域中有重要应用.随着社会网络、移动应用以及在线服务的发展,使得数据收集的效率和规模得到了很大的提高,同时给相似连接操作带来新的挑战.根据集合相似的必要条件,提出了相似集合之间的差异度.利用差异度和鸽巢原理,提出了一种新颖的基于数据划分的集合相似连接计算方法,该方法对集合进行自适应的均衡划分,并利用基于划分块的过滤方法来提高过滤的效率.为了进一步提高过滤的效果和相似连接的效率,利用划分块的位置信息提出了增强的过滤方法.针对提出的方法,在不同的环境下进行了实验,实验结果表明,该方法与已有的方法相比可以有效地提高相似连接的效率.
荣垂田徐天任杜小勇
共1页<1>
聚类工具0