李求实
- 作品数:3 被引量:2H指数:1
- 供职机构:中国人民大学信息学院更多>>
- 发文基金:国家高技术研究发展计划国家科技重大专项中国人民大学科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- XML关键词检索的查询理解被引量:2
- 2012年
- 与纯文本文档集相比,使用语义标签标注的半结构化的XML文档集,有助于信息检索系统更好地理解待检索文档.同样,结构化查询,比如SQL,XQueFy和Xpath,相对于纯关键词查询更加清晰地表达了用户的查询意图.这二者都能够帮助信息检索系统获得更好的检索精度.但关键词查询因其简单和易用性,仍被广泛使用.提出了XNodeRelation算法,以自动推断关键词查询的结构化信息(条件/目标节点类型).与已有的推断算法相比,综合了XML文档集的模式和统计信息以及查询关键词出现的上下文及其关联关系等推断用户的查询意图.大量的实验验证了该算法的有效性.
- 李求实王秋月王珊
- 平衡IO和CPU的XML关键词检索技术
- 由于当前XML在数据交换和数据存储中的普遍应用,基于XML文档的信息检索研究已经成为新的研究热点。XML文档本身含有结构信息可以使其检索精度得到相当大的提高。但相应地,XML检索中使用的更复杂的评分模型(如组合语言模型和...
- 李求实王秋月王珊
- 关键词:语言模型关键词检索
- 文献传递
- 平衡I/O和CPU的XML关键词检索
- 2010年
- 随着XML在数据交换和数据存储中的普遍应用,基于XML文档的信息检索研究逐渐成为新的研究热点。XML文档本身含有的结构信息可以使其检索精度得到很大提高,但相应地,XML检索中使用的较复杂的评分模型(如组合语言模型和推理网络的结构化评分模型)和较细的返回结果粒度(由文档转变为元素或者段落),也使得传统的信息检索由I/O密集型应用转变为CPU密集型应用。针对上述应用特点的转变,提出了一种新的检索处理框架,即保存数据的两种索引形式,根据系统的状态动态地调整任务调度,平衡I/O和CPU的处理,以达到减少单个查询的平均响应时间的目的。
- 李求实王秋月王珊
- 关键词:可扩展标记语言语言模型