您的位置: 专家智库 > >

国家科技支撑计划(2008BAH32B01)

作品数:1 被引量:3H指数:1
相关作者:陆春生徐秀星孙明李庆忠彭朝晖更多>>
相关机构:人力资源和社会保障部山东大学更多>>
发文基金:国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息抽取
  • 1篇信息抽取方法
  • 1篇页面
  • 1篇页面分割
  • 1篇SVM
  • 1篇WEB信息
  • 1篇WEB信息抽...
  • 1篇ADABOO...
  • 1篇抽取
  • 1篇抽取方法

机构

  • 1篇山东大学
  • 1篇人力资源和社...

作者

  • 1篇彭朝晖
  • 1篇李庆忠
  • 1篇孙明
  • 1篇徐秀星
  • 1篇陆春生

传媒

  • 1篇计算机应用与...

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
一种基于SVM和AdaBoost的Web实体信息抽取方法被引量:3
2013年
提出一种基于SVM和AdaBoost的Web实体信息抽取方法。首先提出一种基于SVM的Web页面主数据区域识别方法,基于Web实体实例在页面中的展示特征,有效地将Web页面进行数据区域分割,识别出Web实体实例所在的主数据区域;然后基于Web实体属性标签的特征,提出一种基于AdaBoost的集成学习方法,从页面的主数据区域自动地抽取Web实体信息。在两个真实数据集上进行实验,并与相关研究工作进行比较,实验结果说明该方法能够取得良好的抽取效果。
孙明陆春生徐秀星李庆忠彭朝晖
关键词:WEB信息抽取页面分割
共1页<1>
聚类工具0