您的位置: 专家智库 > >

中央高校基本科研业务费专项资金(2012ZM0083)

作品数:2 被引量:5H指数:2
相关作者:黄翰李英胡廉民郝志峰张宇山更多>>
相关机构:华南理工大学乐山师范学院广东工业大学更多>>
发文基金:中央高校基本科研业务费专项资金国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇早熟收敛
  • 1篇收敛性
  • 1篇爬虫
  • 1篇爬虫算法
  • 1篇网络
  • 1篇网络爬虫
  • 1篇进化策略
  • 1篇进化算法
  • 1篇过滤器
  • 1篇URL

机构

  • 2篇华南理工大学
  • 1篇广东工业大学
  • 1篇南京大学
  • 1篇乐山师范学院
  • 1篇广东财经大学

作者

  • 2篇黄翰
  • 1篇张宇山
  • 1篇胡廉民
  • 1篇李英
  • 1篇郝志峰

传媒

  • 1篇计算机研究与...
  • 1篇计算机应用研...

年份

  • 1篇2014
  • 1篇2013
2 条 记 录,以下是 1-2
排序方式:
二元进化策略的全局收敛与早熟收敛被引量:2
2014年
离散状态马尔科夫链理论已经广泛应用于进化算法的收敛性和时间复杂度分析中,而连续状态马尔科夫过程理论由于需要用到比较高深的数学工具,应用还不多.引入连续状态马尔科夫过程理论,以测度论为工具,借助公理化的条件数学期望理论推导出关键的转移概率的计算公式,分析了以(1+1)ES为代表的连续型进化算法的收敛性,从理论上证明若采用常变异算子,包括正态分布、柯西分布在内的一大类常用变异分布可使(1+1)ES依概率收敛到全局最优解的ε-邻域;构造了一个带适应值平台的函数,从理论上证明某些自适应变异算子即使以正态分布、柯西分布为变异分布也会导致(1+1)ES陷入早熟收敛.通过仿真实验验证了理论分析.结果表明自适应调整机制并非总是有效的.
张宇山郝志峰黄翰
关键词:进化算法进化策略收敛性
基于分层结构保留的增量网络爬虫算法被引量:3
2013年
为了提高目前爬虫算法抓取结果的有效性,提出了一种旨在获取有效信息的改进网络爬虫算法,主要设计了信息的分层结构保留策略和URL过滤模式。在改进算法中,网络资源定位符被分层存储,在保留信息全部拓扑关系的基础上,将交错复杂的URL网络系统从一个图结构变为一个层次分明的树结构。在执行结构模式下,实现了增量爬虫算法。仿真实验以实际网站的BBS为测试数据,结果表明,改进算法比现有网络爬虫算法在爬行速度、下载效率与信息有效性等方面有较大的优势。因此,分层结构策略与URL过滤模式可以在增加少量计算时间的前提下极大提高爬虫抓取页面的有效性。
胡廉民张泽斌徐威迪黄翰李英
关键词:网络爬虫
共1页<1>
聚类工具0