您的位置: 专家智库 > >

李猛

作品数:1 被引量:8H指数:1
供职机构:华中科技大学计算机科学与技术学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇主题信息
  • 1篇自动提取算法
  • 1篇网页
  • 1篇网页分块
  • 1篇网页分类
  • 1篇分块

机构

  • 1篇华中科技大学

作者

  • 1篇李猛
  • 1篇殷贤亮

传媒

  • 1篇华中科技大学...

年份

  • 1篇2007
1 条 记 录,以下是 1-1
排序方式:
基于分块的网页主题信息自动提取算法被引量:8
2007年
对互联网上大量存在的基于模板的网页,根据其半结构化的特点,提出了一种网页分块和主题信息自动提取算法.该算法利用网页标记对网页进行分块,改进了传统的文本特征选择方法,把网页块表示成特征向量,并根据有序标记集识别主题内容块.用该算法改进了网页分类的预处理过程,提高了分类的速度和准确性.实验表明,对网页进行主题信息提取后再进行分类,可以提高分类系统的查全率和查准率.
殷贤亮李猛
关键词:网页分块主题信息网页分类
共1页<1>
聚类工具0