您的位置: 专家智库 > >

教育部科学技术研究重点项目(200146)

作品数:1 被引量:1H指数:1
相关作者:周志光曾强聪曾义聪杨贯中更多>>
相关机构:湖南大学长沙民政职业技术学院更多>>
发文基金:教育部科学技术研究重点项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇主题
  • 1篇概念树

机构

  • 1篇长沙民政职业...
  • 1篇湖南大学

作者

  • 1篇杨贯中
  • 1篇曾义聪
  • 1篇曾强聪
  • 1篇周志光

传媒

  • 1篇计算机工程与...

年份

  • 1篇2008
1 条 记 录,以下是 1-1
排序方式:
基于层次语义的URL排序方法研究被引量:1
2008年
为了提高主题爬取的采集性能,提出了基于层次语义的URL排序算法。主题爬取过程中引入了层次语义的启发信息,采用层次语义组合排序度量进行URL排序,并对层次语义引导主题爬取的采集率性能进行实验研究。实验表明,采用基于层次语义的URL排序方法,爬取过程中由初始URL链接能快速导向某目标主题集的Web文档。同时,当目标主题集的邻近区域没有相关的页面时,逐步放宽主题范围,在较宽的主题区域中爬取,能较快地导向其它不相邻的主题区域。
曾义聪杨贯中周志光曾强聪
关键词:概念树
共1页<1>
聚类工具0