您的位置: 专家智库 > >

任国盛

作品数:3 被引量:8H指数:1
供职机构:兰州理工大学计算机与通信学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 2篇主题漂移
  • 1篇页面
  • 1篇页面分析
  • 1篇用户
  • 1篇用户行为
  • 1篇爬虫
  • 1篇主题爬虫
  • 1篇主题特征
  • 1篇网络
  • 1篇网络爬虫
  • 1篇链接
  • 1篇基于用户
  • 1篇基于用户行为
  • 1篇PAGERA...
  • 1篇PR值

机构

  • 3篇兰州理工大学

作者

  • 3篇任国盛
  • 2篇王旭阳

传媒

  • 1篇计算机工程
  • 1篇计算机科学

年份

  • 2篇2016
  • 1篇2015
3 条 记 录,以下是 1-3
排序方式:
基于用户行为与页面分析的改进PageRank算法被引量:8
2016年
在经典PageRank算法中,页面的转移概率平均分配到链出页面,由于新网页的链接较少,其PR值普遍较低。经典PageRank算法通过链接计算PR值,未考虑到网页的内容,存在主题漂移现象。针对上述问题,引入网页权威因子和时间因子,通过网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页的PR值进行迭代修正,返回一个新的排序结果并分析网页内容,采用改进的TD-IDF算法解决网页相关性,避免主题漂移现象。仿真实验结果表明,改进算法可以提高网页排名的质量,使相关度较高的网页通过人们的自主选择获得不同程度的加权,获得加权的网页在检索结果中的排名得到提升,从而提高用户需求网页的查准率。
王旭阳任国盛
关键词:主题漂移PR值
基于链接的主题爬虫研究
这些年来,由于互联网上的网页数量呈指数增长,爬虫要爬取的信息量过大,它的负荷太过承重导致搜索引擎更新自己的网页数据库速度过慢,不能及时更新最新的消息,因此,主题网络爬虫将变的非常重要,它是一种以人为本的个性化服务体系,这...
任国盛
关键词:网络爬虫主题爬虫PAGERANK算法
文献传递
一种基于最近搜索周期被引用频率的改进WPR算法
2016年
针对WPR(Weighted PageRank)算法存在的在网页搜索方面的主题漂移和偏重旧网页的现象,综合网页的主题特征和最近搜索周期网页的被引用频率两个因素,提出了一种改进的算法WTFPR(Weighted Topic Frequency PageRank)。该算法通过内容分析,采用改进的TD-IDF算法来解决网页相关性,改善主题漂移现象;通过网页的最近搜索周期的被引用频率来提高那些较新而且价值较高的网页的PR值,从而改善偏重旧网页的现象。仿真结果表明,改进后的算法与WPR算法相比获得了更好的效果。
王旭阳任国盛
关键词:主题特征主题漂移
共1页<1>
聚类工具0