您的位置: 专家智库 > >

国家高技术研究发展计划(2008AA02407)

作品数:1 被引量:5H指数:1
相关作者:杨岳湘苏国荣邓劲生更多>>
相关机构:国防科学技术大学更多>>
发文基金:广东省科技计划工业攻关项目湖南省自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇散列
  • 1篇散列函数
  • 1篇去重
  • 1篇网页
  • 1篇网页去重
  • 1篇过滤器
  • 1篇URL
  • 1篇布隆过滤器

机构

  • 1篇国防科学技术...

作者

  • 1篇邓劲生
  • 1篇苏国荣
  • 1篇杨岳湘

传媒

  • 1篇广西师范大学...

年份

  • 1篇2010
1 条 记 录,以下是 1-1
排序方式:
一种去除重复URL的算法被引量:5
2010年
通过对Bloom Filter算法及其改进型在Web信息采集时的去重策略进行分析,结合Dynamic Bloom Filter算法,采用动态数组对集合元素进行表示,提出了一种去重应用策略,实现了对集合中重复URL的频度查询和删除操作支持,最后使用该去重策略进行了实验并和其他策略进行了比较,实验证明该应用策略能够在误判率较低的情况下取得较好的去重效果。
苏国荣杨岳湘邓劲生
关键词:布隆过滤器散列函数URL网页去重
共1页<1>
聚类工具0