您的位置: 专家智库 > >

河北省科学技术研究与发展计划项目(07213597)

作品数:2 被引量:4H指数:1
相关作者:李卫东王瑞江王井阳更多>>
相关机构:河北经贸大学河北科技大学更多>>
发文基金:河北省科学技术研究与发展计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇信息抽取
  • 1篇信息集成
  • 1篇统计分析
  • 1篇网页
  • 1篇网页分析
  • 1篇文献统计
  • 1篇半结构化
  • 1篇DOM
  • 1篇抽取
  • 1篇抽取算法

机构

  • 2篇河北经贸大学
  • 1篇河北科技大学

作者

  • 2篇李卫东
  • 1篇王井阳
  • 1篇王瑞江

传媒

  • 2篇河北省科学院...

年份

  • 2篇2009
2 条 记 录,以下是 1-2
排序方式:
基于DOM的半结构化网页信息抽取算法被引量:4
2009年
为从不同的半结构化网页中自动提取数据记录,提出了基于DOM和记录子树最大相似度发现记录模式的思想,对信息噪声有较强的过滤功能,在记录模式存在一定差异的情况下也能正确识别记录。在此基础上,实现了多记录网页自动抽取的IESS算法,该系统可以从多个学术论文检索网站中自动获取结果网页,并自动抽取其中的记录。对常见论文检索网站的实验表明了该系统具有较好的有效性和准确性。
李卫东
关键词:DOM信息抽取半结构化信息集成
基于三大检索的科技文献统计分析系统的设计与实现
2009年
文中给出了系统的设计思想、体系结构,详细阐述了主要算法IESS的设计与实现。本系统可以帮助用户迅速了解研究领域的文章分布、抓住研究重点。
李卫东王井阳王瑞江
关键词:文献统计网页分析
共1页<1>
聚类工具0