张勇
- 作品数:6 被引量:46H指数:3
- 供职机构:清华大学信息科学技术学院清华信息科学与技术国家实验室更多>>
- 发文基金:国家重点基础研究发展计划湖北省教育厅人文社会科学研究项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 面向复杂数据的对象存储系统被引量:1
- 2014年
- 主要研究了数字图书馆应用中数字对象的有效存储和索引机制,提出并设计了针对数字图书馆的数据仓储系统PuntTable。PuntTable使用非关系模式存储和管理对象,并且通过在数据对象内部建立索引来支持查询。PuntTable包括两个主要模块:一个是PuntStore,一种有多存储引擎的数据存储系统;另一个是PuntIndex,一种支持多种索引方式的索引系统。PuntTable实现了高吞吐量和低延迟对象存储,数据对象的索引和内容都可以选择最为合适的存储层来进行存储。使用实际数字图书馆中的数据对PuntTable进行了测试和评估。在测试所用的数据集中,每个数据都采用不同长度,使测试更加接近实际应用。实验结果显示,对于不同的数据集使用不同的存储模型可以显著增大数据库系统的吞吐量,并且有效减少延迟。
- 兰超张勇张勇
- 关键词:数字图书馆大数据
- 云环境下海量数据资源管理框架被引量:6
- 2011年
- 针对互联网的海量数据的处理,提出了一个管理框架THCloudFramework.该框架包含了云环境下的数据资源管理的各个方面,主要有资源物理存储和逻辑存储、副本管理与迁移、海量存储网划分和负载均衡、资源虚拟化、用户资源使用方式及其资源组合等.分析了存储资源的分布式文件系统实现,详细阐述了海量存储网的生成、更新及其负载均衡.分析了海量数据的统一转换与管理方法.提出了海量信息资源的安全管理实现方法及其资源的组合实现方案.该框架给出了一个云环境下数据资源管理与应用的完整方案,为云计算的研究提供了一种思路.
- 张桂刚李超张勇张勇
- 关键词:存储网络分布式存储
- 一种基于海量信息处理的云存储模型研究被引量:21
- 2012年
- 提出了一种云环境下海量数据组织与资源共享的存储总模型,该模型包括:结构化、半结构化及其非结构化数据与资源的对应存储方法;能兼顾海量大小数据文件处理的分布式文件系统THDFS;云数据库系统设计模型THCloudDB;云环境下强于MapReduce弱于SQL,以Hadoop++为基础的一种针对互联网海量数据文件处理且具有语义计算效能的计算模型THMapReduce;针对THDFS及其THCloudDB的具有语义效能的智能挖掘分析工具THBI;最后以"清华通"为案例分析了该模型平台的具体应用.
- 张桂刚李超张勇张勇
- 关键词:海量信息处理分布式文件系统
- 海量物联网数据安全处理模型研究被引量:15
- 2013年
- 物联网已经成为信息技术发展的重要趋势.如何处理海量物联网数据并且确保这些海量数据的安全变得越来越重要.本文针对互联网的海量数据处理及其安全应用,提出一个海量物联网数据的安全处理模型.该模型主要由海量物联网数据采集、数据存储、基于规则的海量数据处理及其物联网数据安全管理等组成.通过该模型可以较好地实现物联网所产生的海量数据的安全传递、存储及其基于规则的处理等等,达到支撑各种应用的目的.该模型可以应用于各种基于规则的海量物联网数据监测系统如:基于物联网的湖泊水质监测系统、基于物联网的PM2.5监测系统及基于物联网的智能交通监测系统等.
- 张桂刚毕娅李超张勇张勇曾春
- 关键词:物联网海量数据数据安全
- 一种互联网海量情报规则优化方法被引量:1
- 2011年
- 现在很多部门都需要通过规则处理海量情报数据,规则的数量一旦达到海量级规模,对规则的处理技术的要求将会变得越来越高,海量规则的优化将是一个十分重要的问题.文中展示了一种海量规则的优化方法.若两个规则网最后的计算结果是一样的,则可以认为这两个规则网是等价的.基于该等价规则模块的变换可以将代价小的规则模块替换掉代价大的规则模块,从而以后可以选择一种代价最小的规则模块.本文提出规则网模块等价替换的5种优化方法,并对其做了相应的证明.通过优化,可以使得海量规则网处于计算代价尽量最小状态,以此减少处理机的计算工作量.分析表明,通过等价规则替换,可以大大提高规则处理效率.
- 张桂刚张勇张勇尤川川李超邢春晓
- 一种基于Paxos算法的证券交易系统内存复制方法研究被引量:2
- 2012年
- 近年来随着高速网络技术的发展与高频交易需求的增加,提升交易速度成为电子商务交易提供者的重要关切。当前交易系统通常采用基于共享存储的主备机复制方法来保证高可用性与数据持久性,但因其存在持久化的性能瓶颈而无法进一步降低延迟。为此,提出一种基于Paxos算法的内存数据复制方法,即通过消息传递完成主备机复制,以保证结点间数据的一致性,容忍可能发生的良性故障;并以证券交易系统场景为例对其进行分析。实验结果表明,相比基于共享存储的主备机复制,该方法在万兆以太网环境下可将交易系统订单处理延迟由毫秒级降至百微秒级,并在主机故障时正确地完成热备切换。
- 黄晓东张勇张勇邢春晓黄寅飞武剑锋
- 关键词:数据复制高可用性低延迟交易系统