您的位置: 专家智库 > >

杨柳青

作品数:3 被引量:10H指数:1
供职机构:中国科学院计算机网络信息中心更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇专利
  • 1篇期刊文章

领域

  • 1篇自动化与计算...

主题

  • 3篇网页
  • 2篇页面
  • 2篇网页检索
  • 2篇网页正文
  • 2篇联网
  • 2篇互联
  • 2篇互联网信息
  • 1篇信息服务
  • 1篇信息检索
  • 1篇正文
  • 1篇正文内容
  • 1篇正文提取
  • 1篇搜索
  • 1篇搜索结果
  • 1篇索引
  • 1篇网页正文提取
  • 1篇差异化

机构

  • 3篇中国科学院
  • 1篇中国互联网络...

作者

  • 3篇耿光刚
  • 3篇李晓东
  • 3篇杨柳青
  • 2篇洪博
  • 2篇陈勇

传媒

  • 1篇计算机应用研...

年份

  • 1篇2018
  • 1篇2015
  • 1篇2014
3 条 记 录,以下是 1-3
排序方式:
基于布局相似性的网页正文内容提取研究被引量:10
2015年
合理的网页正文提取技术可以将海量互联网数据中冗余的、重复的、无用的信息去除,获取更加有实际意义和价值的数据。经过对网页的观察,发现同一网站下的网页具有在内容布局和样式结构上非常相似的特点,提出并实现了一种基于布局相似性的网页正文提取方法,即通过比对来自同一网站同一专题的网页DOM树中节点数据信息的相似性来实现正文提取,并对相关问题进行了尝试性的研究和实现。实验证明该方法思路简单、实用性强、普适性好,在满足较高准确率的同时,能为众多互联网内容分析应用提供支撑。
杨柳青李晓东耿光刚
关键词:网页正文提取信息检索
一种互联网信息搜索聚合呈现方法
本发明公开了一种互联网信息搜索聚合呈现方法。本方法为:1)在互联网上爬取页面,并根据页面正文内容建立对应该网页的索引;2)根据输入的查询词检索聚合内容库,若存在该查询词对应的应答内容,则将其作为搜索结果返回;若不存在,则...
李晓东杨柳青洪博陈勇耿光刚
文献传递
一种互联网信息搜索聚合呈现方法
本发明公开了一种互联网信息搜索聚合呈现方法。本方法为:1)在互联网上爬取页面,并根据页面正文内容建立对应该网页的索引;2)根据输入的查询词检索聚合内容库,若存在该查询词对应的应答内容,则将其作为搜索结果返回;若不存在,则...
李晓东杨柳青洪博陈勇耿光刚
文献传递
共1页<1>
聚类工具0