2025年2月2日
星期日
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
杨柳青
作品数:
3
被引量:10
H指数:1
供职机构:
中国科学院计算机网络信息中心
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
李晓东
中国科学院计算机网络信息中心
耿光刚
中国科学院计算机网络信息中心
陈勇
中国科学院计算机网络信息中心
洪博
中国科学院计算机网络信息中心
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
专利
1篇
期刊文章
领域
1篇
自动化与计算...
主题
3篇
网页
2篇
页面
2篇
网页检索
2篇
网页正文
2篇
联网
2篇
互联
2篇
互联网信息
1篇
信息服务
1篇
信息检索
1篇
正文
1篇
正文内容
1篇
正文提取
1篇
搜索
1篇
搜索结果
1篇
索引
1篇
网页正文提取
1篇
差异化
机构
3篇
中国科学院
1篇
中国互联网络...
作者
3篇
耿光刚
3篇
李晓东
3篇
杨柳青
2篇
洪博
2篇
陈勇
传媒
1篇
计算机应用研...
年份
1篇
2018
1篇
2015
1篇
2014
共
3
条 记 录,以下是 1-3
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于布局相似性的网页正文内容提取研究
被引量:10
2015年
合理的网页正文提取技术可以将海量互联网数据中冗余的、重复的、无用的信息去除,获取更加有实际意义和价值的数据。经过对网页的观察,发现同一网站下的网页具有在内容布局和样式结构上非常相似的特点,提出并实现了一种基于布局相似性的网页正文提取方法,即通过比对来自同一网站同一专题的网页DOM树中节点数据信息的相似性来实现正文提取,并对相关问题进行了尝试性的研究和实现。实验证明该方法思路简单、实用性强、普适性好,在满足较高准确率的同时,能为众多互联网内容分析应用提供支撑。
杨柳青
李晓东
耿光刚
关键词:
网页正文提取
信息检索
一种互联网信息搜索聚合呈现方法
本发明公开了一种互联网信息搜索聚合呈现方法。本方法为:1)在互联网上爬取页面,并根据页面正文内容建立对应该网页的索引;2)根据输入的查询词检索聚合内容库,若存在该查询词对应的应答内容,则将其作为搜索结果返回;若不存在,则...
李晓东
杨柳青
洪博
陈勇
耿光刚
文献传递
一种互联网信息搜索聚合呈现方法
本发明公开了一种互联网信息搜索聚合呈现方法。本方法为:1)在互联网上爬取页面,并根据页面正文内容建立对应该网页的索引;2)根据输入的查询词检索聚合内容库,若存在该查询词对应的应答内容,则将其作为搜索结果返回;若不存在,则...
李晓东
杨柳青
洪博
陈勇
耿光刚
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张