2025年1月23日
星期四
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
宋凯磊
作品数:
6
被引量:21
H指数:1
供职机构:
西安交通大学
更多>>
发文基金:
教育部“新世纪优秀人才支持计划”
长江学者奖励计划
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
郑庆华
西安交通大学电子与信息工程学院...
董博
西安交通大学电子与信息工程学院...
马瑞
西安交通大学
刘均
西安交通大学
徐海鹏
西安交通大学
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
5篇
专利
1篇
期刊文章
领域
2篇
自动化与计算...
主题
3篇
海量
3篇
HADOOP
3篇
存储方法
3篇
存取
2篇
索引
2篇
索引系统
2篇
索引信息
2篇
文本索引
2篇
逻辑单元
2篇
内存
2篇
HBASE
2篇
存取效率
1篇
元数据
1篇
文本
1篇
文件存取
1篇
缓存
1篇
格式化
1篇
SIM
机构
6篇
西安交通大学
作者
6篇
董博
6篇
郑庆华
6篇
宋凯磊
3篇
刘均
3篇
马瑞
2篇
马天
2篇
陈亚兴
2篇
贺欢
2篇
徐海鹏
1篇
田锋
1篇
马瑞
传媒
1篇
小型微型计算...
年份
1篇
2016
2篇
2013
2篇
2012
1篇
2011
共
6
条 记 录,以下是 1-6
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种基于HBase的构建和检索增量索引的方法
本发明公开了一种基于HBase的构建和检索增量索引的方法,包括以下步骤:基于HBase的列存储机制设计索引的存储结构,使用三个数据表分别保存原始文本、索引信息和统计信息;设计面向Web的待索引文本获取接口,提供基于HTT...
郑庆华
董博
贺欢
宋凯磊
徐海鹏
马天
陈亚兴
文献传递
一种基于Hadoop的海量非独立小文件关联存储方法
本发明公开了一种基于Hadoop的海量非独立小文件关联存储方法,主要解决海量的非独立小文件存取效率和读取效率较低的问题。针对某个大文件被分割成的许多小文件,即非独立小文件,本发明的特征在于:(1)将属于某个大文件的所有小...
郑庆华
董博
刘均
马瑞
宋凯磊
文献传递
一种基于Hadoop 的海量可归类小文件关联存储方法
本发明公开了一种基于Hadoop的海量可归类小文件关联存储方法,主要解决可归类小文件的存取效率问题。本发明包括NameNode端全局索引管理技术和文件聚合技术。针对属于某一类别的独立的小文件进行文件聚合和全局索引管理,大...
郑庆华
董博
刘均
马瑞
宋凯磊
文献传递
一种基于HBase的构建和检索增量索引的方法
本发明公开了一种基于HBase的构建和检索增量索引的方法,包括以下步骤:基于HBase的列存储机制设计索引的存储结构,使用三个数据表分别保存原始文本、索引信息和统计信息;设计面向Web的待索引文本获取接口,提供基于HTT...
郑庆华
董博
贺欢
宋凯磊
徐海鹏
马天
陈亚兴
文献传递
一种基于Hadoop的海量可归类小文件关联存储方法
本发明公开了一种基于Hadoop的海量可归类小文件关联存储方法,主要解决可归类小文件的存取效率问题。本发明包括NameNode端全局索引管理技术和文件聚合技术。针对属于某一类别的独立的小文件进行文件聚合和全局索引管理,大...
郑庆华
董博
刘均
马瑞
宋凯磊
基于多SimHash指纹的近似文本检测
被引量:21
2011年
近似文本检测已成为当前研究热点.基于SimHash指纹的近似文本检测是主流的检测方法之一.但使用SimHash进行近似文本检测存在如下问题:指纹位数单一,丢失了一定量的信息.针对该问题,为使SimHash指纹尽可能多地代表文档的内容或特征,通过对术语集的统计特征分析,提出基于多SimHash指纹和k维超曲面的近似文本检测算法.实验表明基于多Sim-Hash指纹的近似文本检测算法提高了检测的准确率,而且所增加的时间代价很小.
董博
郑庆华
宋凯磊
田锋
马瑞
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张