您的位置: 专家智库 > >

黄玲

作品数:1 被引量:15H指数:1
供职机构:重庆邮电大学计算机科学与技术学院计算机科学与技术研究所更多>>
发文基金:重庆市自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息抽取
  • 1篇主题
  • 1篇主题内容
  • 1篇网页
  • 1篇网页分块
  • 1篇分块
  • 1篇WEB信息
  • 1篇WEB信息抽...
  • 1篇抽取

机构

  • 1篇重庆邮电大学

作者

  • 1篇黄玲
  • 1篇陈龙

传媒

  • 1篇计算机应用

年份

  • 1篇2008
1 条 记 录,以下是 1-1
排序方式:
基于网页分块的正文信息提取方法被引量:15
2008年
网页主题信息通常湮没在大量的无关文字和HTML标记中,给应用程序迅速获取主题信息增加的难度。提出了一种基于网页分块的正文信息抽取方法。该方法首先识别和提取网页正文内容块,然后利用正则表达式和简单的判别规则内容块滤除内容块中的HTML标记和无关文字。实验证明,该方法能够准确地提取网页正文信息,且通用性较强,易于实现。
黄玲陈龙
关键词:WEB信息抽取
共1页<1>
聚类工具0