2025年1月31日
星期五
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
藕军
作品数:
4
被引量:11
H指数:3
供职机构:
合肥工业大学计算机与信息学院计算机网络系统研究所
更多>>
相关领域:
自动化与计算机技术
文化科学
更多>>
合作作者
任明仑
合肥工业大学计算机与信息学院计...
靳鹏
合肥工业大学计算机与信息学院计...
章成志
南京大学信息管理学院
左春荣
合肥工业大学计算机与信息学院计...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
3篇
期刊文章
1篇
学位论文
领域
4篇
自动化与计算...
1篇
文化科学
主题
4篇
引擎
4篇
搜索
4篇
搜索引擎
4篇
索引
2篇
信息抽取
2篇
WEB信息
2篇
WEB信息抽...
2篇
DEEP_W...
2篇
抽取
1篇
元搜索
1篇
元搜索引擎
1篇
元信息
1篇
数据库
1篇
数据库选择
1篇
中文
1篇
自动抽取
1篇
网络
1篇
网络蜘蛛
1篇
相似度
1篇
节点相似度
机构
4篇
合肥工业大学
1篇
南京大学
作者
4篇
藕军
3篇
任明仑
1篇
靳鹏
1篇
左春荣
1篇
章成志
传媒
1篇
情报学报
1篇
现代图书情报...
1篇
现代电子技术
年份
1篇
2008
3篇
2007
共
4
条 记 录,以下是 1-4
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
搜索引擎返回结果自动抽取
被引量:3
2007年
提出一种从搜索引擎返回结果页面上自动抽取结果记录及后续页面链接信息并生成Wrapper的方法:对于一个有效的结果页面,通过比较其HTML标签树上节点的相似度从而识别出潜在记录块,利用启发式规则从潜在记录块中将结果记录块和后续页面链接分别识别出来,然后利用其在标签树上的位置信息分别构造Wrapper。实验结论及与已有方法的比较表明,该方法简单可行且高效。
藕军
任明仑
关键词:
搜索引擎
WEB信息抽取
节点相似度
Deep Web搜索引擎的关键技术
Deep Web中包含着数量巨大、质量很高的信息,却不能被通用搜索引擎搜索.研究Deep Web搜索引擎及其关键技术将有助于实现对Deep Web自动搜索. 首先介绍了通用搜索引擎的一般原理.然后对Deep W...
藕军
关键词:
搜索引擎
数据库
数据库选择
WEB信息抽取
文献传递
中文Deep Web的大小、质量及分布
被引量:2
2008年
Deep Web中包含着大量高质量内容,当前的搜索引擎技术还不能对其进行搜索,研究Deep Web的大小、质量及分布情况将有助于找到对其进行有效搜索的方法和技术。以网络蜘蛛采集的2006年10月的数据为样本,利用统计、概率等定量方法和定性方法,首次对中文Deep Web的大小、质量及分布情况进行调查,得出概况如下:①Deep Web大小比Surface Web的大240倍以上;②包含的文件总数量和总存储量分别为507亿、11700TB;③可搜索数据库数量超过3万个;④内容质量较高;⑤内容主题分布不均匀。
藕军
任明仑
左春荣
章成志
关键词:
DEEP
WEB
中文
WEB
搜索引擎
基于网络蜘蛛的搜索引擎自动发现
被引量:3
2007年
自动发现Web上大量的搜索引擎对于构造大规模元搜索引擎是有益的,提出一种用优化爬行规则的网络蜘蛛自动发现搜索引擎并提取其元信息的方法:通过优化爬行规则的网络蜘蛛爬取页面;利用专门的识别规则从爬取到的页面中识别搜索界面,并提取其相关的元信息。试验结果表明该方法简单有效,自动发现的查准率和查全率分别达到97%和91%。
藕军
任明仑
靳鹏
关键词:
元搜索引擎
网络蜘蛛
元信息
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张