方建滨
- 作品数:54 被引量:17H指数:2
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- Trace驱动并行模拟中的性能优化技术研究
- 并行模拟是一种利用并行宿主机平台将模拟任务并行化从而加速性能模拟的技术,能够较好地满足对大规模计算机系统模拟所需的计算与存储资源。随着未来并行计算机系统和应用的规模、复杂性等的急剧增加,并行模拟本身的效率也迫切需要提高。...
- 方建滨
- 关键词:映射策略
- 一种SPH的向量化并行计算方法及装置
- 本申请涉及一种SPH的向量化并行计算方法、装置、计算机设备和存储介质。所述方法包括:通过将邻近粒子搜索范围内粒子的原始AoS数据重新组织为SoA数据,使得SoA数据符合所使用的SIMD指令集要求,通过SIMD技术的向量化...
- 杨灿群龙思凡郭晓威范小康李超崔英博黄春唐滔彭林方建滨张鹏夏泽宇
- 文献传递
- 面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质
- 本发明涉及计算机高性能计算的可靠性保证领域,公开了一种面向死锁检查的非阻塞MPI程序符号执行方法、系统及介质。针对非阻塞MPI程序的异步性和非确定性,本发明通过为通信操作的不同消息匹配情况和不同交叠执行情况创建不同待探索...
- 于恒彪黄春王戟陈振邦傅先进彭林唐滔左克姜浩沈洁方建滨
- 文献传递
- 一种并行性能模拟中LP到PP的高效映射方法
- LP到PP的高效映射是加速并行性能模拟的关键技术之一。针对交互规则的并行应用程序,设计映射生成方法A2-LP3M从Trace中提取LP间的交互模式,以宿主机物理进程间通信最小化为目标,兼顾计算负载平衡,从循环块映射中选取...
- 方建滨徐传福车永刚翁玉芬王正华
- 关键词:性能模拟通信优化负载平衡交互模式
- 文献传递
- 基于ARMv8多核处理器的小型和不规则矩阵乘优化方法
- 本发明公开了一种基于ARMv8多核处理器的小型和不规则矩阵乘优化方法,利用ARMv8多核处理器实现,其步骤包括:建立矩阵存储空间,用于存放矩阵A与矩阵B相乘得到的结果矩阵C;ARMv8多核处理器对矩阵B执行打包操作,并将...
- 董德尊方建滨杨维玲苏醒庞征斌
- 一种基于转置的向量三角函数快速查表方法及系统
- 本发明公开了一种基于转置的向量三角函数快速查表方法及系统,本发明方法包括:输入索引向量vi与基址地址pb,将索引向量vi保存的偏移量值拆分到标量中,并与基址地址pb相加得到VL个地址,使用向量加载指令将VL个地址处共VL...
- 沈洁龙标黄春唐滔彭林方建滨崔英博张鹏廖霞
- 一种串行与并行模拟相结合的并行计算机系统性能模拟方法
- 本发明公开了一种串行与并行模拟相结合的并行计算机系统性能模拟方法,要解决的技术问题是提高性能模拟准确性和模拟效率。技术方案是先从并行源程序中分离计算代码段,将各计算机代码段封装为可独立执行的串行源程序;接着对串行源程序进...
- 车永刚徐传福王勇献王正华彭宇行陆平静方建滨翁玉芬
- 文献传递
- 使用SIMD指令的向量函数快速查表法、系统及介质
- 本发明公开了一种使用SIMD指令的向量函数快速查表法、系统及介质,快速查表法包括传入操作数,将向量函数的各算法区间的常系数作为被查表数值存入内存中的暂存数组AA,生成查表所需的索引向量VI;使用加载函数将内存中的数组AA...
- 沈洁彭林龙标黄春姜浩唐滔左克方建滨范小康于恒彪崔英博
- 文献传递
- 面向软件超结点的OpenCL编程框架构建方法和装置
- 本申请涉及一种面向软件超结点的OpenCL编程框架构建方法、装置、计算机设备和存储介质。所述方法包括:通过在软件超结点的主结点上启动OpenCL主进程并初始化第一通信端口,通过主结点上的守护进程将第一通信端口广播给软件超...
- 唐滔崔英博黄春彭林杨灿群方建滨张鹏左克于恒彪范小康易昕
- 文献传递
- 基于Trace的并行性能模拟任务映射方法
- 2010年
- 针对Trace驱动的并行性能模拟问题,提出基于Trace信息指导的映射方法CO-LP3M。CO-LP3M利用从Trace中提取的目标应用程序的通信特征,以宿主机物理进程间通信次数最小化为目标,兼顾计算负载均衡,生成并行模拟任务到宿主机的映射。对HPL程序进行实验,结果表明CO-LP3M可有效提高并行模拟性能,相对于常见的映射方式,模拟性能最多提高14.7%。在此基础上给出CO-LP3M的扩展技术SCO-LP3M。
- 方建滨徐传福车永刚翁玉芬王正华
- 关键词:任务映射通信优化负载平衡