张爱民
- 作品数:7 被引量:6H指数:1
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 任务数目和性能感知的可重构多核处理器的资源分配方法
- 一种任务数目和性能感知的可重构多核处理器的资源分配方法,动态可重构多核处理器具有运行时动态重构片上资源的能力,为降低任务平均周转时间,提高系统吞吐率和芯片资源利用率提供了巨大的优化空间。本发明中,在每个操作系统调度间隔内...
- 安虹高晓川王涛邱晓杰韩文廷张爱民
- 文献传递
- 任务数目和性能感知的可重构多核处理器的资源分配方法
- 一种任务数目和性能感知的可重构多核处理器的资源分配方法,动态可重构多核处理器具有运行时动态重构片上资源的能力,为降低任务平均周转时间,提高系统吞吐率和芯片资源利用率提供了巨大的优化空间。本发明中,在每个操作系统调度间隔内...
- 安虹高晓川王涛邱晓杰韩文廷张爱民
- 一种带多级Cache的SIMD众核处理器上的稀疏矩阵存储方法
- 本发明公开了一种带多级Cache的SIMD众核处理器上的稀疏矩阵存储方法,包括:(1)获取矩阵A中行非零元个数最大值a,处理器SIMD单元可同时计算的非零元个数b,计算大于a且为b的倍数的最小值作为临时行宽度;(2)对矩...
- 韩文廷张爱民江霞安虹陈俊仕孙荪汪朝辉
- 基于Intel Xeon Phi的稀疏矩阵向量乘性能优化被引量:1
- 2016年
- 稀疏矩阵向量乘(Sp MV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在Intel Xeon Phi众核集成架构上存在SIM D利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对Intel Xeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比M KL的CSR算法平均快2.05倍.
- 张爱民安虹姚文军梁伟浩江霞李丰
- 关键词:稀疏矩阵向量乘INTELXEONPHI
- OpenACC到MIC平台上并行程序的自动翻译及优化被引量:5
- 2016年
- 随着异构系统在高性能计算领域的流行,各种为异构平台设计的编程模型被提出,比如CUDA、Open CL等,而这些原生的编程模型存在着编程复杂、优化困难和可移植性差等问题.Open ACC标准通过添加编译制导语句指示编译器将相关的代码段或循环卸载到加速器上执行,可以解决这些问题.本文设计并实现了Open ACC到MIC平台上并行程序的自动翻译工具,从而实现了Open ACC对Intel MIC协处理器的支持.同时采取了数据传输优化方法对翻译后的代码进行了优化.实验采用完整的NPB测试包,实验结果表明,我们的翻译工具能够百分之百完成测试程序的翻译,并且针对不同规模的数据集翻译后的Offload代码的性能分别能够达到手工优化的Offload代码性能的74%,76%,80%.
- 江霞安虹梁伟浩张爱民李丰
- 关键词:异构系统OPENACCMIC自动翻译
- 基于星载测雨雷达探测的亚洲对流和层云降水季尺度特征分析
- 利用热带测雨卫星搭载的测雨雷达十年探测结果,本文就季尺度亚洲对流降水和层云降水的降水频次和强度及降水垂直结构的特点进行了研究。结果表明春、秋、冬三季东亚季平均降水环西太副高呈带状分布,雨强一般不超过10mm/d;夏季,沿...
- 傅云飞张爱民刘勇郑媛媛胡运芳冯沙曹爱琴
- 关键词:对流降水层云降水降水频次降水强度雷达探测
- 文献传递
- 一种带多级Cache的SIMD众核处理器上的稀疏矩阵存储方法
- 本发明公开了一种带多级Cache的SIMD众核处理器上的稀疏矩阵存储方法,包括:(1)获取矩阵A中行非零元个数最大值a,处理器SIMD单元可同时计算的非零元个数b,计算大于a且为b的倍数的最小值作为临时行宽度;(2)对矩...
- 韩文廷张爱民江霞安虹陈俊仕孙荪汪朝辉
- 文献传递