吴超 作品数:7 被引量:27 H指数:3 供职机构: 中国科学技术大学 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 医药卫生 理学 更多>>
基于龙芯2F体系结构的BLAS库优化 被引量:14 2008年 在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性代数问题的子程序集合BLAS,提出了新的优化技术,充分发挥龙芯2F处理器的性能,实现了高性能的BLAS.实际测试表明,高性能BLAS在750 MHz的龙芯2F处理器(双精度浮点峰值3 Gflops)上HPL实测峰值达到1.47 GHz,比原始BLAS提高了6倍以上,比ATLAS提高了45%. 顾乃杰 李凯 陈国良 吴超关键词:BLAS 龙芯2F 数据预取 指令调度 基于龙芯2号国产万亿次高性能计算机KD-50-I 陈国良 张俊霞 安学军 张焕杰 吴冬冬 李会民 高翔 孙广中 李春生 顾乃杰 杨寿保 郑启龙 安虹 吴俊敏 蒋承东 杨晓奇 申凯 李晖 李凯 吴超 方维 邹丰富 隋秀峰 该项目采用64位龙芯2F CPU,加上1G内存、I/0控制部件和千兆以太网接口等,构成一无盘工作模块(处理单元)。并采用高密度组装技术,在1U标准机箱内部署12个这样的处理单元,构成一个计算节点。这些处理单元之间通过千兆...关键词:关键词:高性能计算机 龙芯2号 千兆以太网 多核平台上Top-k查询的性能优化 被引量:2 2012年 随着Web搜索引擎等实际应用的发展,Top-k查询的实时性能日益受人关注.为了提升Top-k查询在高性能计算机上的实时性能,本文针对领域中具有代表性的No Radom Access(NRA)程序进行性能分析,根据多核处理器的结构特点,采用分层的优化方法对NRA程序进行并行优化.通过使用数据结构调整,任务调度等方法优化,优化后程序在实验数据集上获得了59%的串行性能提升,并具有接近线性的加速比. 吴超 孙广中 陈国良关键词:TOP-K查询 多核处理器 规范引力对偶以及全息量子色动力学 本文较为系统和全面地回顾了规范引力对偶和全息量子色动力学这一研究领域。首先,文章从量子色动力学的发展历史开始讲起,介绍了大N极限下的量子色动力学、大型强子对撞机的现象学、弦理论的基本概念以及全息原理等内容。然后,通过对诸... 吴超关键词:共形场论 相结构 一种三维快速傅里叶变换并行算法 被引量:8 2011年 三维快速傅里叶变换在物理计算领域中被广泛地使用.传统并行算法所使用的面划分和块划分方法并不适合稀疏三维向量的傅里叶变换.提出了一种新三维快速傅里叶变换的并行算法,针对稀疏三维向量的傅里叶变换,新算法通过重新调整x,y,z三个方向的计算顺序,能最大限度地减少计算量以及进程间的通信量,从而减少计算时间,提高并行加速比.详尽的理论分析以及多个高性能计算平台上的实验结果证明:在对稀疏三维向量作傅里叶变换时,新算法优于传统算法. 方维 孙广中 吴超 陈国良关键词:并行计算 加速比 医联体及其财务管理状况分析 2022年 医联体建设对各级医疗卫生机构改革的财务管理工作提出新的挑战。本研究从分析医联体发展的背景入手,在初步划分医联体类型的基础上,就医联体合作模式对医疗卫生机构财务管理的影响进行了剖析。 戴智敏 戴智敏 罗庆华 黄晓春 吴超 罗庆华关键词:财务管理 信息检索中top-k问题的并行算法及优化研究 随着互联网络的发展,以文本形式存储在网络上的信息呈现爆炸式增长。大量积累的动态信息阻碍了人类对它的有效利用。作为大规模文本集合上信息检索工具的搜索引擎在诞生之初就成为解决网络信息访问的重要工具,并在其后的发展中占据着人类... 吴超关键词:TOP-K 并行计算 分布式存储系统 文献传递