赵开勇
- 作品数:6 被引量:12H指数:2
- 供职机构:香港浸会大学更多>>
- 发文基金:中国科学院重大科研装备研制项目国家重点基础研究发展计划中国科学院知识创新工程更多>>
- 相关领域:自动化与计算机技术生物学更多>>
- 基于GPU平台的联合迭代重构算法加速
- 2012年
- 电子断层三维重构技术(Electron Tomography,ET)是在纳米尺度下研究不具有全同性的细胞或大分子三维结构的重要方法。迭代重构法是ET中重构效果最好的方法,但是其性能较差,重构大尺寸图像时需要数天的时间甚至更长,使其应用受到限制。迭代重构法中经典的方法是代数重构法(Algebraic Reconstruction Technique,ART)和联合迭代重构法(Simultaneous Iterative Reconstruction Technique,SIRT),SIRT算法总是收敛的并且比ART重构的效果更好。利用CUDA语言设计和实现了基于Tesla C1060GPU平台上的并行SIRT重构算法,并利用存储器合并访问、常量存储器、共享存储器等优化技术对并行算法进行优化,优化后的SIRT并行算法在Tesla C1060GPU平台上的最大加速比是Intel i7 920CPU上的串行算法的47倍,并且重构的质量没有任何下降。
- 张广勇卢晓伟沈铂张凯储琪赵开勇
- 关键词:并行计算GPUCUDAATOM
- 一种使用GPU加速地震叠前时间偏移的方法被引量:2
- 2011年
- 应用GPU通用高性能编程技术实现一种加速地震叠前时间偏移的新方法。该技术是地震勘探处理的常规流程,其核心算法具有计算密集、数据独立性强、并行性高等特点。通过性能剖析获得其计算热点,通过CUDA技术对其进行并行化改造,并利用CUDA的流技术实现CPU到GPU的异步传输。通过集群环境下的性能测试,应用GPU并行化的PSTM程序可明显缩短运行时间。
- 张清谢海波赵开勇吴庆陈维王狮虎迟旭光褚晓文
- 关键词:叠前时间偏移地震勘探图像处理器计算统一设备架构
- ATOM 1.0:基于GPU的电子断层重构软件被引量:1
- 2011年
- 电子断层成像技术能够在纳米尺度下重构出不具有全同性的细胞或大分子的三维结构,正受到越来越广泛的重视。针对现有电子断层成像技术中重构软件的不足,特别是迭代重构算法速度慢的缺点,我们开发了一款基于Graphic Processor Unit(GPU)平台的电子断层重构软件——ATOM,实现了图像对位、重构参数计算、三维重构及数据可视化等电子断层重构的基本功能。其中,在二维对位方面,ATOM实现了迭代的无标记平移和旋转对位;在三维重构方面,实现了背投影和多种迭代重构算法,并实现了迭代重构在GPU平台上的并行加速,获得了良好的加速比,如SIRT算法得到了47倍加速比。ATOM是绿色开源软件,可以运行在支持Qt和CUDA的所有操作系统上。ATOM为图形界面软件,结合详尽的安装及使用文档,便于用户使用。
- 储琪张凯万晓华张茨张艳张广勇沈铂卢晓伟赵开勇褚晓文张法孙飞
- 关键词:GPU加速图形界面
- GPU,你可以估得更多、更好——2010年NVIDIA GTC大会现场报道
- 2010年
- GPU的功能绝不仅仅是进行和游戏相关的图形处理,它可以做得更多、更好。在通用计算方面.它已经展现出了令人惊讶的性能表现。在2010年NVIDIA举办的GTC(GPU Technology Conference)大会上,《微型计算机》与全球知名科学家.工程师以及研究人员一同见证了GPU技术的发展。
- 邓斐赵开勇
- 关键词:GPU计算机并行计算
- 使用GPU加速BLAST算法初探被引量:4
- 2009年
- 应用GPU通用高性能编程技术实现了一种加速BLAST算法的新方法。BLAST是目前最常用的用于生物序列查询比对的算法和软件包,其处理速度受到串行化执行和磁盘I/O等因素的影响。本文通过实验分析了BLAST软件包中的典型程序BLASTN的运行热点,并选定关键热点模块,应用CUDA编程技术对其进行并行化改造。对比实验结果表明,对于平均序列长度较大的序列库,应用GPGPU并行化可明显缩短该模块的运行时间,获得超过35倍的加速比。这说明,我们可以利用GPGPU对BLAST进行并行化加速,以满足高性能生物序列查询的需求。
- 万宁谢海波张清赵开勇褚晓文于军
- 关键词:BLASTGPUGPGPUCUDA并行计算
- 基于GPU实现叠前时间偏移走时计算的并行算法被引量:5
- 2011年
- 走时计算是叠前时间偏移计算中最耗时的部分,通过分析传统的串行走时算法,发现静态8点插值算法非常适合在GPU上运行。首先利用CUDA技术对静态8点插值算法进行并行化改造,设计静态8点并行插值算法,然后测试其正确性,统计其相对误差情况。实验表明此算法比工业生产上的动态插值算法更准确,最后我们利用体偏作性能测试。试验结果表明,运行在GPU上的静态8点并行插值算法内核性能是运行在CPU上的动态插值算法内核的22.76倍。这说明,静态8点并行插值算法适合进行走时计算,并且可以应用于工业生产上。
- 张清迟旭光谢海波赵开勇吴庆陈维王狮虎褚晓文
- 关键词:叠前时间偏移地震勘探图形处理器计算统一设备架构走时计算