您的位置: 专家智库 > >

尹万旺

作品数:40 被引量:5H指数:2
供职机构:江南计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术航空宇航科学技术理学电子电信更多>>

文献类型

  • 30篇专利
  • 6篇期刊文章
  • 2篇会议论文

领域

  • 9篇自动化与计算...
  • 1篇电子电信
  • 1篇航空宇航科学...
  • 1篇理学

主题

  • 9篇异构
  • 9篇通信
  • 7篇处理器
  • 6篇网络
  • 5篇内存
  • 5篇集合通信
  • 4篇带宽
  • 4篇描述符
  • 4篇卷积
  • 3篇数据重用
  • 3篇数组
  • 3篇通信优化
  • 3篇主存
  • 3篇线程
  • 3篇感知
  • 3篇MPI
  • 3篇超节点
  • 2篇带宽利用率
  • 2篇低延迟
  • 2篇地址信息

机构

  • 38篇江南计算技术...
  • 1篇北京航空航天...
  • 1篇清华大学
  • 1篇中国空气动力...

作者

  • 38篇尹万旺
  • 28篇魏迪
  • 22篇林蓉芬
  • 13篇王丹云
  • 10篇王飞
  • 8篇杨金才
  • 6篇郑岩
  • 5篇何王全
  • 4篇周明忠
  • 4篇刘勇
  • 3篇李芳
  • 3篇刘鑫
  • 3篇陆林生
  • 2篇陈德训
  • 2篇徐金秀
  • 2篇王涛
  • 1篇漆锋滨
  • 1篇张娟
  • 1篇卿鹏
  • 1篇方燕飞

传媒

  • 2篇计算机科学
  • 1篇计算机应用与...
  • 1篇空气动力学学...
  • 1篇计算机工程与...
  • 1篇科研信息化技...
  • 1篇2006年全...

年份

  • 1篇2024
  • 2篇2023
  • 15篇2022
  • 4篇2021
  • 1篇2020
  • 1篇2019
  • 3篇2018
  • 3篇2016
  • 1篇2014
  • 1篇2013
  • 3篇2012
  • 1篇2011
  • 2篇2006
40 条 记 录,以下是 1-10
排序方式:
一种胖树网络结构上的通信优化方法
本发明公开一种胖树网络结构上的通信优化方法,包括以下步骤:S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数M=N*(1/X),M为同时通信时,理论上能用满带宽的超节点...
王飞林蓉芬尹万旺郑岩袁欣辉魏迪孙浩男孙强史俊达
文献传递
一种异构众核架构上基于膨胀取数的卷积运算方法
本发明公开一种异构众核架构上基于膨胀取数的卷积运算方法,包括以下步骤:S1、输入input、权重weight、跨步stride,其中input为Hi*Wi,weight为K*K,根据input和weight的形状计算输出...
袁欣辉尹万旺林蓉芬魏迪郑岩王飞孙浩男孙强史俊达王丹云
基于异构众核处理器的卷积计算数据重用方法
本发明公开一种基于异构众核处理器的卷积计算数据重用方法,CPU通过数据块A和数据块B完成数据块C的卷积计算,包括以下步骤:S1、根据异构众核处理器的内核数,二维映射成N*N个,将数据块A、数据块B、数据块C划分为N*N块...
林蓉芬袁欣辉尹万旺魏迪杨金才王丹云董恩铭
基于异构众核处理器的多级访存方法、离散访存方法
本发明公开了一种基于异构众核处理器的多级访存方法及离散访存方法。所述多级访存方法包括:从核读入第一次计算所需的数据;除第一次之外,从核在进行本次数据计算的同时,读入下一次计算所需的数据;除最后一次之外,从核在进行本次数据...
陈德训尹万旺周明忠孙唯哲
一种基于扁平化模型的通信实现方法
本发明提供了一种基于扁平化模型的通信实现方法,可用于点对点通信和集合通信。所述方法包括:运算核心将用户消息的描述符在内存中进行组装;所述运算核心通过写内存方式,将描述符地址信息作为消息请求通知给控制核心;所述控制核心通过...
魏迪何王全尹万旺刘勇王涛
文献传递
高可靠性集群中MPI的设计与实现
高可靠性集群软件系统主要由三部分组成:事件日志系统、检查点系统和MPI环境.本文介绍了一种为高可靠性集群设计的MPI实现SW-MPIFT,阐述了其基于悲观消息日志与非一致性检查点相结合的容错协议.并通过与其他MPI实现的...
尹万旺周明忠
关键词:检查点系统
文献传递
MPI并行调试与优化策略在三维绕流气体运动论数值模拟中的应用被引量:2
2012年
从求解三维绕流问题的Boltzmann模型方程的数值模拟程序出发,通过研究区域分解并行计算策略,引入输入/输出、通信与CACHE等优化策略,对数值模拟程序进行MPI并行化移植与高性能计算调试。以高空稀薄过渡流区飞行器绕流状态为算例,进行了MPI大规模并行计算测试,证实了所发展的MPI并行化区域分解策略及程序优化途径的正确性。研究表明开展的并行化实现能明显地缩短模式计算时间,并取得较好的效果。
徐金秀李志辉尹万旺
关键词:BOLTZMANN模型方程并行计算
基于序列号机制的消息保序方法
本发明公开一种基于序列号机制的消息保序方法,包括以下步骤:S1、每进行一次异步消息发送操作时,发送端将当前的发送序列号打包入包头,并将发送序列号加1;S2、接收端每成功接收一次异步消息,将当前的接收序列号和包头中携带的发...
袁欣辉林蓉芬尹万旺魏迪杨金才王丹云宋超博
文献传递
一种低延迟旁路的消息优化方法
本发明公开一种低延迟旁路的消息优化方法,该方法采用旁路方式,对于满足一定长度要求的用户消息请求,采用快速旁路方式处理,减少用户函数到底层消息操作的调用层次;同时,不在通信支撑环境中对用户消息数据以及包头进行组包操作,而是...
魏迪尹万旺王丹云袁欣辉林蓉芬杨金才
文献传递
面向LICOM2的并行I/O优化被引量:2
2014年
全球变暖导致自然灾害频度和强度都有所增加,发展高精度地球系统模式,对防灾减灾、促进经济发展有重要意义。随模式分辨率提高,地球系统模式的I/O性能正逐渐成为制约模式可扩展性和计算效率的瓶颈。本文针对地球系统模式的I/O问题,以代表性的海洋环流模式LICOM2为研究对象,全面分析了地球系统模式的典型I/O特点,研究通用的高并发I/O技术。本文设计实现了LICOM2系统的ADIOS并行读写方案,都取得了显著的优化效果。LICOM2系统ADIOS优化在天河1A系统内网测试,在288-6480并行度下I/O时间占比均不到4%,在6480并行度下写带宽达8.46GB/s。本文通过在天河1A上的大量测试,对提高LICOM2系统的I/O性能做了进一步的研究,不同系统配置会对I/O性能有影响。
季旭武海平邹寅隆梁亚雄薛巍尹万旺林鹏飞刘海龙俞永强
关键词:海洋环流模式
共4页<1234>
聚类工具0