您的位置: 专家智库 > >

国家自然科学基金(60221120145)

作品数:8 被引量:132H指数:4
相关作者:马范援叶允明张岭宋晖李扬更多>>
相关机构:上海交通大学南通工学院更多>>
发文基金:国家自然科学基金上海市基础研究重大(重点)项目更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 8篇自动化与计算...
  • 1篇文化科学

主题

  • 3篇网络
  • 2篇对等网
  • 2篇信息检索
  • 2篇计算机
  • 2篇计算机网
  • 2篇计算机网络
  • 2篇哼唱检索
  • 2篇分布式
  • 1篇对等网络
  • 1篇对等网络技术
  • 1篇对象抽取
  • 1篇信息资源
  • 1篇搜索
  • 1篇爬虫
  • 1篇网络技术
  • 1篇网页
  • 1篇文本分类
  • 1篇路由
  • 1篇路由算法
  • 1篇结构化查询

机构

  • 5篇上海交通大学
  • 1篇南通工学院

作者

  • 4篇马范援
  • 2篇宋晖
  • 2篇张岭
  • 2篇叶允明
  • 1篇刘宝龙
  • 1篇吴亚栋
  • 1篇邹福泰
  • 1篇邵浩然
  • 1篇李扬
  • 1篇张亮
  • 1篇于水
  • 1篇王杰华
  • 1篇吴镇德

传媒

  • 1篇计算机研究与...
  • 1篇电子学报
  • 1篇计算机工程
  • 1篇计算机应用与...
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇Journa...
  • 1篇Journa...

年份

  • 1篇2006
  • 2篇2005
  • 1篇2004
  • 2篇2003
  • 2篇2002
8 条 记 录,以下是 1-8
排序方式:
基于标记树对象抽取技术的Hidden Web获取研究被引量:31
2002年
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。
宋晖张岭叶允明马范援
关键词:标记树对象抽取信息检索结构化查询
对等网信息检索的研究现状与展望被引量:15
2004年
随着对等网(P2P)研究的进一步深入以及P2P网络中Peer结点和共享文件的进一步增多,如何在非集中式的P2P网络中发现所需要的文件已经成为P2P从研究走向实用的关键所在。该文首先提出了P2P挖掘的概念,然后指出P2P信息检索作为P2P挖掘中的一部分,已经成为P2P研究的一个热点。接下来提出了P2P网络的路由、搜索、挖掘的框架模型,指明了该领域研究的框架。然后分层综述了P2P信息检索的进展状况,对各种检索方法做了深入分析。并指出了它们各自的优缺点和应用局限性,最后对今后的P2P信息检索领域的发展方向进行了展望。
张亮邹福泰马范援
关键词:对等网信息检索信息资源计算机网络
分布式Web Crawler的研究:结构、算法和策略被引量:33
2002年
本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页.
叶允明于水马范援宋晖张岭
关键词:WEB爬虫分布式系统计算机网络网页
基于分布式聚类的Peer-to-Peer路由算法被引量:2
2005年
提出了分布式聚类算法,该算法自动对地理邻近的对等结点聚类,消除了集中式聚类算法的单点瓶颈问题,及分布式Binning算法的landmark放置问题;提出了一种基于该聚类的邻居路由算法,该算法消除了na?ve算法路由效率低、IP-snoop算法实现困难及处理开销大、directed算法需要处理超级节点失效时容错问题。实验结果表明,基于分布式聚类的Peer-to-Peer(P2P)路由算法比现有的结构化路由算法减少了近一倍的路由跳转和路由时延。
邵浩然吴镇德王杰华马范援
关键词:聚类PEER-TO-PEER路由算法聚类算法分布式LANDMARK
一种新的近似旋律匹配方法及其在哼唱检索系统中的应用被引量:47
2003年
提出了一种近似旋律匹配(approximate melody matching)的新方法——线性对齐匹配法,并在此基础上实现了一个哼唱检索(query by humming)系统原型.与已有的基于内容的音乐检索(content-based music retrieval)不同,该算法并非基于近似符号串匹配、统计模型或者特征空间,而是根据相近旋律的音高轮廓在几何上的相似性,将音高和节奏特征一并考虑所设计而成的全新算法.通过实验检验该算法的有效性,在含有3864首乐曲的搜索空间中,检索62段人声哼唱,线性对齐匹配法取得了90.3%的前3位命中率,相比传统的近似符号匹配算法高出11%以上.这一实验结果有力地表明了线性对齐匹配法的有效性,及其应用于大型数字音乐检索引擎的可行性.
李扬吴亚栋刘宝龙
关键词:哼唱检索
KRBKSS: a keyword relationship based keyword-set search system for peer-to-peer networks被引量:1
2005年
may incur significant bandwidth for executing more com- plicated search queries such as multiple-attribute queries. In order to reduce query overhead, KSS (keyword-set search) by Gnawali partitions the index by a set of keywords. However, a KSS index is considerably larger than a standard inverted index, since there are more word sets than there are individual words. And the insert overhead and storage overhead are obviously un- acceptable for full-text search on a collection of documents even if KSS uses the distance window technology. In this paper, we extract the relationship information between query keywords from websites’ queries logs to improve performance of KSS system. Experiments results clearly demonstrated that the improved keyword-set search system based on keywords relationship (KRBKSS) is more efficient than KSS index in insert overhead and storage overhead, and a standard inverted index in terms of communication costs for query.
张亮邹福泰马范援
关键词:P2P网络对等网络技术关键字搜索
一种哼唱检索的新方法被引量:2
2003年
文章提出了一种近似旋律匹配的新方法--线性对齐匹配法.与已有的基于内容的音乐检索不同,该算法并非基于近似符号串匹配、统计模型或者特征空间,而是根据相近旋律的音高轮廓在几何上的相似性,将音高和节奏特征一并考虑设计而成的全新算法.在含有1652首乐曲的搜索空间中,检索57段人声哼唱,该方法取得了93%的前3位命中率.这一实验结果表明了线性对齐匹配法的有效性,及其应用于大型数字音乐检索引擎的可行性.
李扬
关键词:哼唱检索
Accurate performance estimators for information retrieval based on span bound of support vector machines被引量:1
2006年
Support vector machines have met with significant success in the information retrieval field, especially in handling text classification tasks. Although various performance estimators for SVMs have been proposed, these only focus on accuracy which is based on the leave-one-out cross validation procedure. Information-retrieval-related performance measures are always neglected in a kernel learning methodology. In this paper, we have proposed a set of information-retrieval-oriented performance estimators for SVMs, which are based on the span bound of the leave-one-out procedure. Experiments have proven that our proposed estimators are both effective and stable.
于水叶允明马范援
关键词:文本分类
共1页<1>
聚类工具0