2024年7月20日
星期六
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
李明铭
作品数:
2
被引量:1
H指数:1
供职机构:
武汉理工大学
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
严炜
武汉理工大学
李春林
武汉理工大学
周敏
武汉理工大学
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
学位论文
1篇
专利
领域
1篇
自动化与计算...
主题
2篇
网页
1篇
正文
1篇
正文内容
1篇
正则
1篇
正则表达式
1篇
删除
1篇
数据处理
1篇
爬虫
1篇
网页解析
1篇
网页内容
1篇
聚焦爬虫
1篇
互联
1篇
互联网
1篇
键值
1篇
和解
1篇
HADOOP
机构
2篇
武汉理工大学
作者
2篇
李明铭
1篇
周敏
1篇
李春林
1篇
严炜
年份
1篇
2016
1篇
2015
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于Hadoop的网络聚焦爬虫抓取策略和解析方法研究
近年来互联网的发展速度越来越快,海量资源出现在网络上,以聚焦爬虫为核心的垂直搜索引擎因其针对性和准确性的优势更受用户欢迎。但现有聚焦爬虫网页抓取及解析方法还存在以下几个问题:(1)爬行策略中仅考虑链接结构或网页内容单方面...
李明铭
关键词:
网页解析
互联网
数据处理
文献传递
云环境中基于DOMTree的网页内容分析提取优化方法
本发明涉及一种云环境中基于DOMTree的网页内容分析提取优化方法,该方法包括:生成DOM树;去script和style块;从各个叶子节点开始,对具有相同标签路径的不同兄弟节点间进行合并;如果叶节点的父节点不包含任何兄弟...
李春林
李明铭
周敏
毛习均
杜书猛
严炜
赵张承
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张