刘凤晨
- 作品数:2 被引量:2H指数:1
- 供职机构:东华大学信息科学与技术学院更多>>
- 发文基金:国家高技术研究发展计划上海市科学技术委员会基础研究重点项目更多>>
- 相关领域:自动化与计算机技术更多>>
- n-Gram/2L索引结构的存储与时间优化算法被引量:2
- 2008年
- 对分词检索算法n-Gram/2L的索引结构作了改进,在第二级倒排表中加入对文章标识的索引,提出一种基于Zigzag的分词检索算法n-Gram/2LZ(n-Gram/2LonZigzagjoin)。在对数据量较大的文章进行检索和索引时,该算法在保留原有算法特性的基础上进一步减少了索引冗余,降低了索引的存储量,同时对查询算法的优化降低了查询时的系统开销,并且减少索引中记录访问次数,提高了查询效率。
- 刘凤晨刘庆文胡玥黄河
- 关键词:索引N-GRAM倒排表
- 随机跳跃索引:一种支持随机插入的可信赖索引
- 2009年
- 跳跃索引是一种可信赖性索引,但只能为严格单调递增的序列建立索引,不能处理非顺序序列.为了解决这个问题,文中提出了一种新的索引,它可以对任意顺序的序列建立索引,并且依然保证索引的可信赖性.通过在原有跳跃索引结构中加入左侧跳跃指针的方法,索引节点可以根据待加入节点值的大小将其纳入自己的左侧或右侧指针以处理随机序列;索引结构中的每一个节点到根节点的路径固定且唯一,保证了索引的可信赖性.实验结果和理论证明都表明该索引是可以处理随机序列的可信赖索引,相对原有索引,索引建立复杂度明显降低且具有相同的查找复杂度.文中的创新之处是在保证索引的可信赖性的基础上解决了跳跃索引不能为随机序列建立索引的问题.
- 刘凤晨黄河刘庆文丁永生
- 关键词:可信赖性倒排表索引B+树