您的位置: 专家智库 > >

李明铭

作品数:2 被引量:1H指数:1
供职机构:武汉理工大学更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇学位论文
  • 1篇专利

领域

  • 1篇自动化与计算...

主题

  • 2篇网页
  • 1篇正文
  • 1篇正文内容
  • 1篇正则
  • 1篇正则表达式
  • 1篇删除
  • 1篇数据处理
  • 1篇爬虫
  • 1篇网页解析
  • 1篇网页内容
  • 1篇聚焦爬虫
  • 1篇互联
  • 1篇互联网
  • 1篇键值
  • 1篇和解
  • 1篇HADOOP

机构

  • 2篇武汉理工大学

作者

  • 2篇李明铭
  • 1篇周敏
  • 1篇李春林
  • 1篇严炜

年份

  • 1篇2016
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
基于Hadoop的网络聚焦爬虫抓取策略和解析方法研究
近年来互联网的发展速度越来越快,海量资源出现在网络上,以聚焦爬虫为核心的垂直搜索引擎因其针对性和准确性的优势更受用户欢迎。但现有聚焦爬虫网页抓取及解析方法还存在以下几个问题:(1)爬行策略中仅考虑链接结构或网页内容单方面...
李明铭
关键词:网页解析互联网数据处理
文献传递
云环境中基于DOMTree的网页内容分析提取优化方法
本发明涉及一种云环境中基于DOMTree的网页内容分析提取优化方法,该方法包括:生成DOM树;去script和style块;从各个叶子节点开始,对具有相同标签路径的不同兄弟节点间进行合并;如果叶节点的父节点不包含任何兄弟...
李春林李明铭周敏毛习均杜书猛严炜赵张承
文献传递
共1页<1>
聚类工具0