郭若飞
- 作品数:4 被引量:7H指数:1
- 供职机构:苏州大学计算机科学与技术学院智能化信息处理技术研究所更多>>
- 发文基金:国家自然科学基金江苏省现代企业信息化应用支撑软件工程技术研发中心开放基金江苏省基础研究计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Choquet积分的深层网数据源选择被引量:1
- 2011年
- 提出一种基于Choquet模糊积分的深层网数据源选择方法。通过在1组关键字上的查询结果评价深层网数据源的质量,评价时不仅考虑到关键字间的权重,同时还考虑多个关键字之间存在的交互作用。实验结果表明,该方法有效,且对深层网数据源的评价更接近真实。
- 郭若飞蔡欣宝赵朋朋崔志明
- 关键词:数据源选择CHOQUET模糊积分
- 支持Ajax的Deep Web爬虫技术研究
- Deep Web中包含了大量有价值的信息,并且信息量在快速增长。随着 Web2.0的发展,越来越多的Deep Web网站开始运用Ajax技术来改善用户体验。但由于Ajax技术可以异步方式与服务器交互,实现无刷新的动态改变...
- 郭若飞
- 关键词:查询接口WEB爬虫信息抽取
- 文献传递
- 面向Deep Web的Ajax查询接口技术研究
- 2010年
- Deep Web网站采用Ajax技术后使得获取其数据信息更加困难。查询接口处理是获取Deep Web数据的关键步骤,针对采用Ajax技术的Deep Web查询接口,建立Ajax分析处理模型,解决传统爬虫无法完成表单提交的困难,从而获取到更多的Deep Web数据。实验结果证实,该方法是有效的。
- 郭若飞蔡欣宝赵朋朋崔志明
- 关键词:爬虫AJAX查询接口DEEPWEB爬虫
- Web论坛数据源增量爬虫的研究被引量:5
- 2010年
- 针对Web论坛站点结构复杂、内容更新快等特点,提出一种针对论坛的增量信息采集算法,使用站点地图重建技术及网页更新频繁度估计方法,根据站点地图选择有效的链接,按照网页更新频度确定网页的采集频度。实验结果表明,该方法是有效的。
- 蔡欣宝郭若飞赵朋朋崔志明
- 关键词:WEB论坛站点地图