国家高技术研究发展计划(2008AA01A201) 作品数:33 被引量:61 H指数:5 相关作者: 刘宏伟 吴智博 窦勇 杨孝宗 董剑 更多>> 相关机构: 哈尔滨工业大学 国防科学技术大学 沈阳军区总医院 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 国际科技合作与交流专项项目 更多>> 相关领域: 自动化与计算机技术 自然科学总论 文化科学 理学 更多>>
基于FPGA的高精度科学计算加速器研究 被引量:10 2012年 探索了FPGA平台加速高精度科学计算应用的能力和灵活性.首先,研究科学计算中最常用的操作——向量内积,提出基于定点操作的精确向量内积算法.以IEEE 754-2008标准的四精度(Quadruple Precision)浮点算术为例,在FPGA平台上设计了一个基于全展开方法的全流水四精度浮点乘累加单元(QPMAC):提出两级存储策略精确存储乘累加和;采用保留进位累加策略减少定点加法器位宽、简化进位处理、优化关键路径;引入累加和划分策略,实现流水吞吐率.最后,在XC5VLX330FPGA芯片上设计一个LU分解和MGS-QR分解加速器原型来验证QPMAC的性能.实验结果表明,与运行在Intel四核处理器上的基于OpenMP的并行算法相比,集成4个QP-MAC单元的加速器能获得42倍到97倍的性能提升,并且能获得更高结果精度和更低能量消耗. 雷元武 窦勇 郭松关键词:LU分解 FPGA 硬件加速器 考虑组件复制的SA软件部署可靠性研究 2012年 复制软件组件能提高服务的可靠性和系统可靠性,然而,复制额外的软件组件需要消耗系统可用系统资源.为了充分利用系统可用资源,得到更高的可靠性优化值,设计了启发式的贪婪复制算法,该算法根据单位带宽的可靠性优化值增量OB和单位内存的可靠性优化值增量OM,利用贪婪思想选择出将被复制的两个软件组件集合,其中具有更高可靠性优化值的集合是该算法确定的将被复制的软件组件集合.实验结果表明:当给定有限的系统可用资源时,与贪婪复制算法相比,该算法能得到更高的可靠性优化值和更高的服务可靠性. 苏喜红 刘宏伟 吴智博 杨孝宗 左德承关键词:可靠性 软件体系结构 基于芯片多线程处理器的性能测试及分析 被引量:1 2010年 芯片多线程处理器给现代商业负载带来了高吞吐率和并行化高性能,同时也给操作系统和软件的设计以及性能优化带来难题。为此,设计一种完全可定制的集成负载多线程测试方法,在多种负载配置下对芯片多线程处理器进行性能测试,分析不同调度方式对性能的影响,为操作系统多线程调度提出优化思想。 唐夷简 廖湘科 邵立松关键词:亲和性 对等网络中基于失效规律的自适应失效检测器研究 失效检测是维护对等网络高效运行的基础组件之一,所能提供的服务质量(准确性和检测速度)及其产生的检测负载对P2P系统的可用性和运行效率都有着极大的影响。如何在保障准确性的前提下,以较低的负载快速发现失效节点是失效检测器的设... 任潇 董剑 刘宏伟 李洋 杨孝宗关键词:对等网络 服务质量 文献传递 基于CPU-GPU混合计算平台的RNA二级结构预测算法并行化研究 被引量:5 2013年 RNA二级结构预测是生物信息学领域重要的研究方向,基于最小自由能模型的Zuker算法是目前该领域最典型使用最广泛的算法之一。本文基于CPU+GPU的混合计算平台实现了对Zuker算法的并行和加速。根据CPU和GPU计算性能的差异,通过合理的任务分配策略,实现二者之间的并行协作计算和处理单元间的负载平衡;针对CPU和GPU的不同硬件特性,对Zuker算法在CPU和GPU上的实现分别采取了不同的并行优化方法,提高了混合加速系统的计算性能。实验结果表明,CPU处理单元在混合系统中承担了14%以上的计算任务,与传统的多核CPU并行方案相比,采用混合并行加速方法可获得15.93的全局加速比;与最优的单纯GPU加速方案相比,可获得16%的性能提升,并且该混合计算方案可用于对其它生物信息学序列分析应用的并行和加速。 夏飞 朱强华 金国庆关键词:生物信息学 RNA二级结构预测 可靠性代价和Makespan驱动的分布式容错调度算法 2012年 为解决异构分布式环境下采用主副版本策略的可靠性调度问题,提出一种基于优先级约束的可靠性代价和Makespan(调度时长)驱动的分布式容错调度算法DRCAMD。该算法可在满足系统可调度性的前提下,以异构分布式环境的节点、通信链路的可靠性与Makespan做为可调节局部目标函数,实现具有较高可靠性及较短执行时间的容错调度策略,避免将任务分配到失效率较高的节点上执行。另外,算法的副版本采用被动和主副重叠方式执行,使得容错调度算法具有较大的灵活性。仿真实验表明,该算法性能优于现有容错算法。 景维鹏 吴智博 刘宏伟 董剑一种仿生的面向可重构多细胞阵列的分布式定序方法 2011年 提出一种仿生的面向多细胞阵列的分布式定序方法.该方法是基于生物学上的图式形成理论,通过催化剂-抑制剂模型在多细胞阵列中建立浓度梯度,并在此基础上进行定序.该方法具有如下的特点:跟现有的多细胞阵列维序方法相比,它采用主动的维序方式;跟传统的分布式定序方法相比,它不需要初始特征值就能实现定序和维序.故障注入实验表明,该定序方法较现有的方法具有更强的鲁棒性,在细胞出错的情况下能够重新建立浓度梯度和重新定序.此外,我们在Xilinx公司的型号为Virtex-6 XC6VLX760的FPGA芯片上实现了5x5多细胞阵列,对浓度梯度建立和重建时间及硬件资源开销进行了评估. 吕启 徐佳庆 窦勇 冯雪关键词:仿生 一种基于数据访问特征的层次化缓存优化设计 2011年 随着片上可集成的处理器核数增加,多核处理器的片上通信延迟不断增大,目录存储开销也随之线性增长.层次化缓存结构将片上缓存递归划分为多级区域,并将数据复制到各级区域内以减小片上通信延迟,同时通过多级目录结构降低了目录存储开销.文中通过对数据访问特征进行分析,提出一种新型改进层次化缓存结构(EHCD),将从片外读入的数据直接放置在请求者所属的底层区域内,在降低延迟的同时,保证私有数据在片上最后一级缓存中只有一份副本,提高片上存储的空间利用率,具有良好的可扩展性.对16核处理器的实验结果表明,EHCD设计比传统共享缓存结构执行时间平均减少24%,比原有层次化缓存设计执行时间平均减少15%,具有很好的优化效果. 李崇民 王海霞 张熙 汪东升关键词:片上多处理器 延迟容忍移动传感器网络中基于社会网络的数据传输策略 2011年 延迟容忍移动传感器网络(DTMSN)是一种广泛应用的数据采集网络.提出一种基于社会网络的数据传输策略SNBD(social network-based data delivery scheme)应用于DTMSN.SNBD引入社会网络中的相互作用强度和相称机制,通过计算两传感器节点之间的相互作用强度值和相称值,作为消息传输时选择下一跳的依据.为了优化节点队列,SNBD采用消息的重要因子和TTL决定队列中消息传递的优先顺序和丢弃原则.模拟实验表明,与现有的几种数据传输策略相比,SNBD不但具有较高的数据传输成功率,而且具有较低的数据传输能耗和传输延迟,并且通过分析发现SNBD的网络寿命是SRAD和FAD的8倍. 邝祝芳 陈志刚 邓晓衡关键词:延迟容忍移动传感器网络 数据传输 队列管理 多核平台下事务处理类应用性能分析及评价 在线事务处理(OLTP)是商业服务领域的重要应用,片上多核处理器是当前处理器发展的主流,所以OLTP在多核处理器上的性能特征成为设计和评价商用多核服务系统的主要标准.分别利用体系结构模拟器,模拟了单芯片单核与单芯片双核两... 李鑫 窦勇 邓林 张劲关键词:OLTP 多核处理器 文献传递