您的位置: 专家智库 > >

宋凯磊

作品数:6 被引量:21H指数:1
供职机构:西安交通大学更多>>
发文基金:教育部“新世纪优秀人才支持计划”长江学者奖励计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇专利
  • 1篇期刊文章

领域

  • 2篇自动化与计算...

主题

  • 3篇海量
  • 3篇HADOOP
  • 3篇存储方法
  • 3篇存取
  • 2篇索引
  • 2篇索引系统
  • 2篇索引信息
  • 2篇文本索引
  • 2篇逻辑单元
  • 2篇内存
  • 2篇HBASE
  • 2篇存取效率
  • 1篇元数据
  • 1篇文本
  • 1篇文件存取
  • 1篇缓存
  • 1篇格式化
  • 1篇SIM

机构

  • 6篇西安交通大学

作者

  • 6篇董博
  • 6篇郑庆华
  • 6篇宋凯磊
  • 3篇刘均
  • 3篇马瑞
  • 2篇马天
  • 2篇陈亚兴
  • 2篇贺欢
  • 2篇徐海鹏
  • 1篇田锋
  • 1篇马瑞

传媒

  • 1篇小型微型计算...

年份

  • 1篇2016
  • 2篇2013
  • 2篇2012
  • 1篇2011
6 条 记 录,以下是 1-6
排序方式:
一种基于HBase的构建和检索增量索引的方法
本发明公开了一种基于HBase的构建和检索增量索引的方法,包括以下步骤:基于HBase的列存储机制设计索引的存储结构,使用三个数据表分别保存原始文本、索引信息和统计信息;设计面向Web的待索引文本获取接口,提供基于HTT...
郑庆华董博贺欢宋凯磊徐海鹏马天陈亚兴
文献传递
一种基于Hadoop的海量非独立小文件关联存储方法
本发明公开了一种基于Hadoop的海量非独立小文件关联存储方法,主要解决海量的非独立小文件存取效率和读取效率较低的问题。针对某个大文件被分割成的许多小文件,即非独立小文件,本发明的特征在于:(1)将属于某个大文件的所有小...
郑庆华董博刘均马瑞宋凯磊
文献传递
一种基于Hadoop 的海量可归类小文件关联存储方法
本发明公开了一种基于Hadoop的海量可归类小文件关联存储方法,主要解决可归类小文件的存取效率问题。本发明包括NameNode端全局索引管理技术和文件聚合技术。针对属于某一类别的独立的小文件进行文件聚合和全局索引管理,大...
郑庆华董博刘均马瑞宋凯磊
文献传递
一种基于HBase的构建和检索增量索引的方法
本发明公开了一种基于HBase的构建和检索增量索引的方法,包括以下步骤:基于HBase的列存储机制设计索引的存储结构,使用三个数据表分别保存原始文本、索引信息和统计信息;设计面向Web的待索引文本获取接口,提供基于HTT...
郑庆华董博贺欢宋凯磊徐海鹏马天陈亚兴
文献传递
一种基于Hadoop的海量可归类小文件关联存储方法
本发明公开了一种基于Hadoop的海量可归类小文件关联存储方法,主要解决可归类小文件的存取效率问题。本发明包括NameNode端全局索引管理技术和文件聚合技术。针对属于某一类别的独立的小文件进行文件聚合和全局索引管理,大...
郑庆华董博刘均马瑞宋凯磊
基于多SimHash指纹的近似文本检测被引量:21
2011年
近似文本检测已成为当前研究热点.基于SimHash指纹的近似文本检测是主流的检测方法之一.但使用SimHash进行近似文本检测存在如下问题:指纹位数单一,丢失了一定量的信息.针对该问题,为使SimHash指纹尽可能多地代表文档的内容或特征,通过对术语集的统计特征分析,提出基于多SimHash指纹和k维超曲面的近似文本检测算法.实验表明基于多Sim-Hash指纹的近似文本检测算法提高了检测的准确率,而且所增加的时间代价很小.
董博郑庆华宋凯磊田锋马瑞
共1页<1>
聚类工具0