翟季冬
- 作品数:54 被引量:22H指数:3
- 供职机构:清华大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论理学文化科学更多>>
- 性能故障诊断的方法及计算机设备
- 本发明实施例涉及计算机技术领域,尤其涉及一种性能故障诊断的方法及计算机设备。所述方法包括:获取目标程序对应的至少两个程序切片,于所述各个程序切片,获取所述各个程序切片对应的第一性能信息,于所述各个程序切片对应的所述第一性...
- 郑立言翟季冬陈文光
- 文献传递
- 性能分析编程框架、方法和装置
- 本发明实施例提供了一种性能分析编程框架、方法和装置,所述方法包括:根据从待测程序中提取出的应用数据,构建程序抽象图;根据用户定义的性能分析数据流图,基于程序抽象图进行性能分析,得到性能分析报告,性能分析数据流图是根据用户...
- 翟季冬金煜阳钟闰鑫王豪杰
- 文献传递
- 存储系统基准评测程序生成方法及装置
- 提供了存储系统基准评测程序生成方法和装置,属于高性能计算性能评测领域。存储系统基准评测程序生成方法包括:从规范化后的源程序获得中间代码;识别中间代码中的切片起点;基于识别得到的切片起点进行静态程序切片;以及基于得到的各个...
- 翟季冬刘明亮陈文光
- 文献传递
- 基于CUPTI接口的GPU程序负载特征分析
- GPU加速设备的高性能计算机已经成为目前高性能计算领域一个重要发展趋势.然而,在当前的GPU设备上开发高效的并行程序仍然是一件非常复杂的事情.针对这一问题,本文首先总结了影响GPU程序性能的几个关键性能指标.然后,采用N...
- 郑祯翟季冬李焱陈文光
- 关键词:高性能计算机图形处理器
- 桌面文本搜索系统性能分析与并行实现
- 本文分析了桌面文本搜索应用的指令级特征,发现该应用具有内存带宽利用率低、CPI值相对比较高、分支预测失效率高的特点,并设计了基于倒排索引技术和向量空间模型的并行桌面搜索系统,取得了较好的加速比。研究结果表明,桌面文本搜索...
- 翟季冬栗强刁倩陈文光张益民郑纬民
- 关键词:向量空间模型倒排索引
- 文献传递
- 一种大规模并行程序性能预测实现方法
- 本发明公开了一种基于有代表性重放的大规模并行程序性能预测实现方法,该方法属于并行程序性能预测的技术领域,包括步骤:收集并行程序的通信序列和顺序计算向量,分析各个进程计算的相似性并选取有代表性的进程,记录有代表性进程的通信...
- 郑纬民陈文光翟季冬
- 文献传递
- 高效训练百万亿参数预训练模型的系统挑战和对策被引量:3
- 2022年
- 随着预训练模型规模的急剧增长,训练此类模型需要海量的计算和存储能力。为此,本工作在新一代国产高性能计算机上训练了一个174万亿参数的超大规模预训练模型,模型参数量可与人脑中的突触数量相媲美。重点讨论在训练这一超大规模预训练模型中遇到的几个关键系统挑战:如何选取高效并行策略,如何进行高效数据存储,如何选取合适的数据精度,以及如何实现动态负载均衡,并总结了针对上述挑战的一些解决方法。
- 马子轩翟季冬韩文弢陈文光郑纬民
- 关键词:人工智能超级计算机异构系统
- 混合网络系统、通信方法和网络节点
- 提供了混合网络系统、通信方法和网络节点。混合网络系统包括点对点网络和广播网络的组合网络体系架构,点对点网络具有多个点对点信道,每个网络节点能够经由点对点信道将消息发送到对应的网络节点或者从对应的网络节点接收消息;广播网络...
- 郑纬民陈文光薛巍翟季冬陈康
- 文献传递
- 基于配置文件的并行程序自动映射实现方法
- 基于配置文件的并行程序自动映射实现方法属于并行程序进程映射的技术领域,其特征是:自动获取目标平台的网络拓扑图,减少用户干预;对并行程序中每条组通信按照分解知识库中分解算法拆分成对应进程的点通信并形成组通信矩阵,把得到的组...
- 郑纬民陈文光翟季冬张瑾
- 文献传递
- 一种作业调度方法和计算装置
- 本发明提供了一种作业调度方法和计算装置,该方法包括:在检测到计算资源不足以运行当前的队首作业时,计算相应的回填窗口;缩短非队首作业对应的运行时间估计,并根据缩短后的运行时间估计判断所述非队首作业是否能够回填,并在判断为是...
- 牛双诚翟季冬陈文光郑纬民刘明亮