2025年1月10日
星期五
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
许文
作品数:
2
被引量:17
H指数:1
供职机构:
北京信息科技大学中文信息处理研究中心
更多>>
发文基金:
国家自然科学基金
北京市教育委员会科技发展计划
北京市教委资助项目
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
李渝勤
北京信息科技大学中文信息处理研...
施水才
北京信息科技大学中文信息处理研...
都云程
北京信息科技大学中文信息处理研...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
会议论文
领域
2篇
自动化与计算...
主题
2篇
信息提取
2篇
信息提取方法
2篇
网页
2篇
网页主题
2篇
HTML
1篇
网页模板
1篇
相关度
1篇
服务质量
1篇
DOM
机构
2篇
北京信息科技...
作者
2篇
都云程
2篇
施水才
2篇
李渝勤
2篇
许文
传媒
1篇
现代图书情报...
1篇
第二十届全国...
年份
1篇
2007
1篇
2006
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种通用HTML网页主题信息提取方法
Web页面所表达的“主题”信息通常隐藏在大量无关结构和文字中,准确完整地提取网页主题信息是影响Web应用服务质量的关键技术之一。目前的提取方法多依赖于网页模板信息,而Web上的网页模板不计其数,因此这些方法缺乏通用性。且...
许文
都云程
李渝勤
施水才
关键词:
服务质量
文献传递
一种通用HTML网页主题信息提取方法
被引量:17
2007年
采用DOM规范,把HTML网页表示成树结构,对不同模板的HTML页面“主题”信息提取进行研究和分析,提出一种新的结点主题相关性判定方法,依据此方法判定出要抽取的主题内容,并删除无关内容,结果输出只含主题信息的HTML文档。
许文
都云程
李渝勤
施水才
关键词:
DOM
信息提取
相关度
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张