张旭东
- 作品数:9 被引量:32H指数:3
- 供职机构:北京大学信息科学技术学院网络与信息系统研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术一般工业技术电子电信历史地理更多>>
- 基于网页质量的静态索引剪枝方法
- 本发明公开了一种基于网页质量的静态索引剪枝方法,涉及互联网搜索引擎技术领域,包括:S1:计算待剪枝网页的重要度,所述重要度包括:网页权威性、网页内容的有用性或用户关注度;S2:根据所述重要度计算所述待剪枝网页的信息保留比...
- 闫宏飞单栋栋张旭东李晓明
- 文献传递
- 一维氧化锌纳米材料的制备研究
- 该论文在物理气相沉积原理的基础上发展出一种新的方法制备氧化锌纳米结构,其特点是:不添加任何其它元素的催化剂,成分分析表明产物的化学成分纯度很高;制备出的氧化锌纳米棒样品呈规则的六角柱体几何外形,晶体结构完整,几乎不存在缺...
- 张旭东
- 关键词:氧化锌纳米线纳米管蓝光发射
- 缅甸近代民族主义运动研究
- 张旭东
- 关键词:民族主义
- 类单晶氧化锌纳米棒的制备与表征被引量:19
- 2004年
- 用简单的无催化剂、高温热蒸发方法制备氧化锌纳米棒 ,得到了具有良好晶体结构和规则外形的ZnO纳米棒 ,长度为 (1- 5 ) μm ,直径约几十纳米。测量了ZnO纳米棒的光致发光特性。讨论了实验条件对纳米棒生长结果的影响 。
- 张旭东邢英杰奚中和薛增泉张蔷俞大鹏
- 关键词:晶体结构光致发光特性半导体
- 浅析电子白板支撑下的课堂交互设计
- 在20世纪90年代末,交互式电子白板的应用潜力开始在中小学课堂教学中得到承认。为此,交互式电子白板厂家开发了适合中小学教学的多媒体资源库以及教学应用软件与工具,包括支持学科教学的图形资源库、支持教师备课的科技开发软件、支...
- 张旭东
- 关键词:电子白板课堂教学软件工程
- 中国GDP的统计遗漏与重估
- 关于中国GDP统计遗漏的争论由来已久,但是在学术界,系统性的研究文献却很少,有着严密推导并得出量化结论的就更少了。针对这一研究领域的不足,本文尝试借助于2007年投入产出表,以及SNA统计标准与我国统计制度中的口径不一致...
- 张旭东
- 关键词:中国经济国内生产总值计算方法产业结构
- 基于指令集并行的倒排索引压缩算法的研究
- 在大数据时代,海量数据使得压缩技术变得越来越重要。同样地,对于搜索引擎来讲,高效的压缩算法将会提升倒排索引的查询性能和空间利用率。近十年来,计算机处理器得到了快速发展,提供了性能卓越的SIMD指令集。如果把SIMD指令集...
- 张旭东
- 关键词:倒排索引整数编码信息检索搜索引擎查询性能
- 基于64位体系结构的倒排索引压缩算法被引量:5
- 2014年
- 在64位体系结构的CPU中,字长从32位扩展到64位,处理器每次可以处理的数据也增加到64位。这对搜索引擎使用的核心数据结构——倒排索引的压缩与解压缩带来一定的影响。针对当前32位整数字对齐压缩算法Simple不适用于64位系统的问题,对其进行改进,并提出3种基于64位的字对齐压缩算法,即SimpleX64-16、SimpleX64-32和SimpleX64-64。3种算法都采用多种压缩模式,并对每个模式进行压缩空间的优化。在64位机器上GOV2和ClueWeb09B数据集的倒排索引实验结果表明,与传统的基于32位字对齐的压缩算法相比,3种基于64位字对齐的算法在解压速度方面最多提高14.5%,在压缩率方面最多提高2.5%。
- 张旭东孙志明刘亚宁单栋栋闫宏飞
- 关键词:倒排索引索引压缩搜索引擎信息检索
- 基于指令级并行的倒排索引压缩算法被引量:7
- 2015年
- 文本信息数量的快速增长给传统的信息检索技术带来了新的挑战.搜索引擎通常使用倒排索引来高效地处理查询.为了减少存储开销和加快访问速度,倒排索引通常被压缩存储.因此,如何选择一个高性能的压缩算法对高效查询处理是非常有必要的.在已有倒排链压缩算法PackedBinary和PForDelta的基础上,利用CPU的超标量特性和SIMD向量指令集,将其压缩和解压缩中的关键步骤并行化,提出了2种指令级并行压缩算法SIMD-PB和SIMD-PFD.基于GOV2和ClueWeb09B两个公开数据集的实验表明,SIMD-PB和SIMD-PFD算法在压缩率不变的情况下,压缩和解压缩速度比现有的压缩算法均有非常明显的提升.其中解压缩速度比起目前最好的倒排链压缩算法,最高能提升17%.此外,实验表明算法在较长的倒排链、较大的压缩块单位上有更好的解压缩性能.
- 闫宏飞张旭东单栋栋毛先领赵鑫
- 关键词:倒排索引整数编码信息检索