张利军
- 作品数:34 被引量:100H指数:6
- 供职机构:西北工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- HDFS下海量小文件高效存储与索引方法被引量:5
- 2015年
- 分布式文件系统HDFS被用来存储大文件,若在其中存储海量小文件将会严重消耗Name Node内存,影响系统性能,同时小文件也不利于使用MapReduce框架进行并行处理和分析.另外,小文件附带的多维元信息也需要以一种合理的方式进行存储和索引以便于查询.本文针对以上问题,提出一种基于多维列索引的小文件管理方案,支持文件的并发上传、下载及删除操作,并在多个查询维度上提供文件的自由检索.本文提出的小文件合并方案能够明显减少HDFS上的文件数量,经过实验对比,在小文件元信息的查询效率方面,本文提出的多维索引方案优于HBase,同时保证了文件传输的吞吐量.
- 肖玉泽张利军潘巍张小芳李战怀
- 关键词:HDFS
- 基于频繁关联标签序列的XML结构相似度度量方法
- 本发明公开了一种基于频繁关联标签序列的XML结构相似度度量方法,解析XML文档集C得到标签序列数据库TSDB;从TSDB中挖掘所有的频繁标签序列集合FTS;从中选出极大频繁标签序列集MFTS;转化得到新的数据库TSDB’...
- 张利军李战怀陈群李霞
- 文献传递
- 一种基于树形无效动作屏蔽的DQN数据库索引推荐方法
- 本发明公开了一种基于树形无效动作屏蔽的DQN数据库索引推荐方法,在给定数据库表结构、数据、查询负载的情况下可为数据库设计与运维人员推荐最优的索引设计方案。在传统DQN的基础上,首先使用Double DQN和Dueling...
- 吴杨李宁潘天蕊张利军
- 一种面向金融应用的海量分布式关系数据库被引量:9
- 2019年
- 提出了一种面向金融应用的海量分布式数据库架构CBase,该架构融合了关系数据库和非关系型数据库的优点,既支持关系查询和跨行跨表的事务处理,又支持数据的分布式存储和节点的快速扩展.系统改进了现有分布式数据库单点故障的问题,具有较高的吞吐率和快速的响应时间,已经在银行业务中得到实际应用.实践证明:该数据库可满足金融业务对于大数据存储和查询的性能需求.
- 刘文洁李戬勃李战怀张利军
- 关键词:单点故障金融应用关系数据库
- MXDR:一种基于关键字的XML多文档分布式检索方法被引量:3
- 2011年
- 基于关键字的XML检索技术是近几年信息检索领域的研究热点。但是由于关键字缺少XML结构语义信息,检索结果和用户需求偏差较大,检索质量难以提高;而XML结构检索由于用户难以提出准确描述查询意图的查询表达式而难以普及。另一个更突出的问题是现有的XML检索研究绝大多数都集中在单文档上,缺乏实用性。因此提出一种基于关键字的结构检索方法,即用分布式方式实现对多XML文档的检索,简称为MXDR(Multi-XMLDistributed Retrieval)。MXDR首先用一种兼顾结构和内容的聚类方法对多文档进行分类,通过分析查询关键字和类别结构信息,确定分布查找策略,再结合查询关键字和XML的结构信息,构建结构查询语句,最后通过结构查询系统实现关键字检索。在多组真实数据Sigmod数据集上的验证结果表明,与经典的SLCA方法比较,MXDR方法具有较高的查全率和查准率,尤其在检索效率上MXDR方法有显著优势。
- 李霞李战怀张利军陈群李宁
- 关键词:关键字检索分布式
- 基于频繁关联标签序列的XML结构相似度度量方法
- 本发明公开了一种基于频繁关联标签序列的XML结构相似度度量方法,解析XML文档集C得到标签序列数据库TSDB;从TSDB中挖掘所有的频繁标签序列集合FTS;从中选出极大频繁标签序列集MFTS;转化得到新的数据库TSDB’...
- 张利军李战怀陈群李霞
- Ropeway:基于语义相关的XML关键字搜索引擎
- XML数据包含丰富的语义信息,但现有的大多数XML搜索引擎并未利用这一信息。如何利用XML数据的语义信息提高检索质量已成为当前研究所关注的问题。设计并实现了一个基于语义相关的XML关键字搜索引擎:Ropeway。对于用户...
- 郭文琪温馨王鹏张利军陈群李战怀
- 关键词:XML数据
- 一种考虑标签语义的XML关键字查询算法被引量:1
- 2011年
- 针对XML(可扩展标记语言)文档提出的信息单元和信息特征的概念,利用信息单元作为候选查询结果,以信息特征表征标签信息,结合XML文档的结构语义,在TF*IDF模型的基础上,设计了查询结果的相关度排序策略.该策略同时涉及了查询结果的结构信息和内容信息,计算了信息特征的重要性,且能利用信息特征的重要性衡量不同信息特征下关键字的语义相关度,进而设计并实现了关键字查询算法XRIU.实验结果表明XRIU在查询质量上优于现有的主要算法.
- 娄颖李战怀陈群张利军
- 关键词:关键字查询语义
- 一种基于高效元路径上下文感知学习的异质图属性补全方法
- 本发明公开了一种基于高效元路径上下文感知学习的异质图属性补全方法,首先利用图结构信息和元路径信息对节点进行编码,接下来通过上下文感知注意力来填充缺失的属性,最后补全的属性被输入到异质图神经网络中来进行下游任务。本发明有效...
- 张艳宁王鹏陈耿张利军
- 面向不确定数据的闭序列挖掘方法
- 本发明公开了一种面向不确定数据的闭序列挖掘方法,用于解决现有面向不确定数据的闭序列挖掘方法精度差的技术问题。技术方案是首先将不确定数据成功地转换为确定数据的序列挖掘,并从中剪枝掉那些非闭序列,再加上“概率频繁”性质检查过...
- 尤涛杜承烈王川文张利军徐伟
- 文献传递