2025年2月13日
星期四
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
王燕华
作品数:
1
被引量:20
H指数:1
供职机构:
上海海洋大学信息学院
更多>>
发文基金:
上海市教育委员会重点学科基金
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
刘宗田
上海大学计算机工程与科学学院
廖涛
上海大学计算机工程与科学学院
王利
上海大学计算机工程与科学学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
正文提取
1篇
网页
1篇
网页正文
1篇
网页正文提取
1篇
文本相似度
1篇
相似度
机构
1篇
上海大学
1篇
上海海洋大学
作者
1篇
王利
1篇
廖涛
1篇
刘宗田
1篇
王燕华
传媒
1篇
计算机工程
年份
1篇
2010
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于内容相似度的网页正文提取
被引量:20
2010年
提出一种将复杂的网页脚本进行简化并映射成一棵易于操作的树型结构的方法。该方法不依赖于DOM树,无须用HTMLparser包进行解析,而是利用文本相似度计算方法,通过计算树节点中文本内容与各级标题的相似度判定小块文本信息的有用性,由此进行网页清洗与正文抽取,获得网页文本信息,实验结果表明,该方法对正文抽取具有较高的通用性与准确率。
王利
刘宗田
王燕华
廖涛
关键词:
文本相似度
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张