公共文化服务平台

共 8 条记录，以下是 1-8

全选清除导出

排序方式：

基于标记树对象抽取技术的Hidden Web获取研究被引量：31: 2002年; 目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。; 宋晖张岭叶允明马范援; 关键词：标记树对象抽取信息检索结构化查询

对等网信息检索的研究现状与展望被引量：15: 2004年; 随着对等网(P2P)研究的进一步深入以及P2P网络中Peer结点和共享文件的进一步增多,如何在非集中式的P2P网络中发现所需要的文件已经成为P2P从研究走向实用的关键所在。该文首先提出了P2P挖掘的概念,然后指出P2P信息检索作为P2P挖掘中的一部分,已经成为P2P研究的一个热点。接下来提出了P2P网络的路由、搜索、挖掘的框架模型,指明了该领域研究的框架。然后分层综述了P2P信息检索的进展状况,对各种检索方法做了深入分析。并指出了它们各自的优缺点和应用局限性,最后对今后的P2P信息检索领域的发展方向进行了展望。; 张亮邹福泰马范援; 关键词：对等网信息检索信息资源计算机网络

分布式Web Crawler的研究:结构、算法和策略被引量：33: 2002年; 本文介绍了一个大型分布式Web Crawler系统——Igloo 1.2版。它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页.; 叶允明于水马范援宋晖张岭; 关键词：WEB爬虫分布式系统计算机网络网页

基于分布式聚类的Peer-to-Peer路由算法被引量：2: 2005年; 提出了分布式聚类算法,该算法自动对地理邻近的对等结点聚类,消除了集中式聚类算法的单点瓶颈问题,及分布式Binning算法的landmark放置问题;提出了一种基于该聚类的邻居路由算法,该算法消除了na?ve算法路由效率低、IP-snoop算法实现困难及处理开销大、directed算法需要处理超级节点失效时容错问题。实验结果表明,基于分布式聚类的Peer-to-Peer(P2P)路由算法比现有的结构化路由算法减少了近一倍的路由跳转和路由时延。; 邵浩然吴镇德王杰华马范援; 关键词：聚类 PEER-TO-PEER 路由算法聚类算法分布式 LANDMARK

一种新的近似旋律匹配方法及其在哼唱检索系统中的应用被引量：47: 2003年; 提出了一种近似旋律匹配(approximate melody matching)的新方法——线性对齐匹配法,并在此基础上实现了一个哼唱检索(query by humming)系统原型.与已有的基于内容的音乐检索(content-based music retrieval)不同,该算法并非基于近似符号串匹配、统计模型或者特征空间,而是根据相近旋律的音高轮廓在几何上的相似性,将音高和节奏特征一并考虑所设计而成的全新算法.通过实验检验该算法的有效性,在含有3864首乐曲的搜索空间中,检索62段人声哼唱,线性对齐匹配法取得了90.3％的前3位命中率,相比传统的近似符号匹配算法高出11％以上.这一实验结果有力地表明了线性对齐匹配法的有效性,及其应用于大型数字音乐检索引擎的可行性.; 李扬吴亚栋刘宝龙; 关键词：哼唱检索

KRBKSS: a keyword relationship based keyword-set search system for peer-to-peer networks被引量：1: 2005年; may incur significant bandwidth for executing more com- plicated search queries such as multiple-attribute queries. In order to reduce query overhead, KSS (keyword-set search) by Gnawali partitions the index by a set of keywords. However, a KSS index is considerably larger than a standard inverted index, since there are more word sets than there are individual words. And the insert overhead and storage overhead are obviously un- acceptable for full-text search on a collection of documents even if KSS uses the distance window technology. In this paper, we extract the relationship information between query keywords from websites’ queries logs to improve performance of KSS system. Experiments results clearly demonstrated that the improved keyword-set search system based on keywords relationship (KRBKSS) is more efficient than KSS index in insert overhead and storage overhead, and a standard inverted index in terms of communication costs for query.; 张亮邹福泰马范援; 关键词：P2P网络对等网络技术关键字搜索

一种哼唱检索的新方法被引量：2: 2003年; 文章提出了一种近似旋律匹配的新方法--线性对齐匹配法.与已有的基于内容的音乐检索不同,该算法并非基于近似符号串匹配、统计模型或者特征空间,而是根据相近旋律的音高轮廓在几何上的相似性,将音高和节奏特征一并考虑设计而成的全新算法.在含有1652首乐曲的搜索空间中,检索57段人声哼唱,该方法取得了93%的前3位命中率.这一实验结果表明了线性对齐匹配法的有效性,及其应用于大型数字音乐检索引擎的可行性.; 李扬; 关键词：哼唱检索

Accurate performance estimators for information retrieval based on span bound of support vector machines被引量：1: 2006年; Support vector machines have met with significant success in the information retrieval field, especially in handling text classification tasks. Although various performance estimators for SVMs have been proposed, these only focus on accuracy which is based on the leave-one-out cross validation procedure. Information-retrieval-related performance measures are always neglected in a kernel learning methodology. In this paper, we have proposed a set of information-retrieval-oriented performance estimators for SVMs, which are based on the span bound of the leave-one-out procedure. Experiments have proven that our proposed estimators are both effective and stable.; 于水叶允明马范援; 关键词：文本分类

全选清除导出

共1页<1>

国家自然科学基金(60221120145)