李中博
- 作品数:4 被引量:3H指数:1
- 供职机构:东北大学信息科学与工程学院更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金教育部重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 支持块编辑距离的索引结构
- 在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性。如何有效的支持块编辑距离,进行近似字符串查询处理具有重要的意义。计算两个字符串的块编辑距离是一...
- 王斌郭庆李中博杨晓春
- 关键词:近似字符串匹配索引结构查询处理
- 文献传递
- 支持块编辑距离的索引结构
- 在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性。如何有效的支持块编辑距离,进行近似字符串查询处理具有重要的意义。计算两个字符串的块编辑距离是一...
- 王斌郭庆李中博杨晓春
- 关键词:近似字符串匹配索引
- 文献传递
- 支持块编辑距离的索引结构被引量:3
- 2010年
- 在近似字符串匹配中,传统的编辑距离不能很好地衡量诸如人名、地址等数据的相似关系,而块编辑距离可以很好地衡量两个字符串的相似性.如何有效地支持块编辑距离,进行近似字符串查询处理具有重要的意义.计算两个字符串的块编辑距离是一个NP完全问题,因此希望提供有效的方法可以增强过滤能力,并减少假通过率.设计了一种支持移动编辑距离的新颖的索引结构SHV-Trie,通过研究移动编辑距离的操作特性,使用字母出现的频率作为支持移动编辑距离操作的一个下界,并且提出相应的查询过滤算法,同时,针对索引SHV-Trie的空间开销过大的问题,提出一种优化字母排列的索引结构和一种压缩的索引结构及相关查询过滤算法.真实数据集上的实验结果与分析显示了所提出的索引结构具有良好的过滤能力,并通过减少效率假通过率提高查询的效率.
- 王斌郭庆李中博杨晓春
- 关键词:近似字符串匹配索引NP完全问题
- 支持大规模压缩序列的在线子串查询处理与优化技术
- 随着社会的进步和科学的发展,信息数据量呈爆炸性增长,特别是基因序列这样的数据,其增长速度已经超出了人们的想象,给数据存储和传输造成了很大的压力,各种压缩技术被提出来解决这样的问题。在压缩序列上进行子串查询处理对于基因序列...
- 李中博
- 关键词:在线查询索引
- 文献传递