您的位置: 专家智库 > >

宋庆增

作品数:16 被引量:24H指数:2
供职机构:天津工业大学计算机科学与软件学院更多>>
发文基金:天津市应用基础与前沿技术研究计划国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术电子电信理学更多>>

文献类型

  • 12篇期刊文章
  • 2篇学位论文
  • 1篇会议论文

领域

  • 12篇自动化与计算...
  • 2篇理学
  • 1篇电子电信

主题

  • 6篇FPGA
  • 4篇硬件
  • 4篇阵列
  • 4篇可重构
  • 4篇可重构计算
  • 4篇处理器
  • 3篇现场可编程
  • 3篇线性方程组
  • 2篇时域有限
  • 2篇时域有限差分
  • 2篇时域有限差分...
  • 2篇稀疏线性方程...
  • 2篇现场可编程门...
  • 2篇协处理
  • 2篇协处理器
  • 2篇门阵列
  • 2篇可编程逻辑
  • 2篇可编程逻辑门...
  • 2篇可编程门阵列
  • 2篇基于FPGA

机构

  • 9篇天津工业大学
  • 9篇河北工业大学
  • 3篇广东工业大学
  • 2篇哈尔滨工业大...
  • 2篇天津理工大学

作者

  • 15篇宋庆增
  • 6篇顾军华
  • 5篇武继刚
  • 2篇周博君
  • 2篇李国燕
  • 2篇王江峰
  • 2篇张二路
  • 1篇侯向丹
  • 1篇刘恩海
  • 1篇王瑞昆
  • 1篇韩冬
  • 1篇张金珠
  • 1篇陆益财
  • 1篇张静
  • 1篇张金珠
  • 1篇薛永江
  • 1篇范培培
  • 1篇赵雷
  • 1篇韩冬

传媒

  • 2篇计算机工程
  • 2篇计算机应用与...
  • 2篇计算机工程与...
  • 1篇计算机工程与...
  • 1篇微电子学与计...
  • 1篇计算机应用
  • 1篇计算机与数字...
  • 1篇现代电子技术
  • 1篇计算机测量与...
  • 1篇2015全国...

年份

  • 1篇2018
  • 1篇2017
  • 3篇2015
  • 4篇2013
  • 4篇2011
  • 1篇2010
  • 1篇2007
16 条 记 录,以下是 1-10
排序方式:
稀疏磁共振图像重建算法的GPU并行设计与实现被引量:1
2013年
基于压缩感知CS(Compressed Sensing)理论的稀疏磁共振图像MRI(Magnetic Resonance Imaging)重构算法包含大量的浮点运算,重构所花费的时间要远远大于傅里叶正反变换重构算法。针对该问题,利用图形处理器GPU(Graphic Processing Unit)强大的并行处理能力,在NVIDIA CUDA(Compute Unified Device Architecture)的框架上对正交匹配追踪OMP(Orthogonal Matching Pursuit)算法进行并行化的设计与实现。实验结果表明,基于GPU实现的算法具有较高的迭代重构速度,对1 0242大小的磁共振图像的重构仅为1.4秒,是CPU实现的24倍,可以满足实际应用对实时性的要求。
李国燕侯向丹顾军华宋庆增周博君
关键词:图形处理器统一计算设备架构压缩感知
电磁场数值计算的FPGA加速技术研究
本文针对各种嵌入式应用中对实时电磁场计算的需求,采用FPGA作为硬件加速器,加速电磁场特定算法(时域有限差分法,时域伪谱法和有限元)的计算。将电磁场数值计算问题(时域有限差分法,时域伪谱法)转换成数字信号处理问题,在FP...
宋庆增
关键词:电磁场硬件加速器FPGA技术
文献传递
稀疏矩阵向量乘的FPGA设计与实现被引量:3
2011年
针对传统的通用处理器(GPP)平台上执行稀疏矩阵向量乘计算效率低的问题,提出一种基于可重构计算平台的SpMXV协处理器设计。方案采用二叉树结构高度流水的数据流、IEEE-754的32 bit浮点数数据格式和对角存储格式。数据通路以流水线方式进行组织,能够优化计算性能。仿真结果表明,与GPP平台上的软件实现相比,通过硬件实现的设计能达到最高2.69倍的性能加速。
宋庆增顾军华
关键词:可重构计算协处理器稀疏线性方程组稀疏矩阵向量乘
3D FDTD算法的GPU实现及优化技术研究
FDTD算法是电磁场领域使用非常广泛的数值计算方法,该方法具有很好的精度与灵活性,已成为求解各种电磁场问题的有力的工具.半导体技术的快速发展使得CPU的计算性能有了飞跃性的进步,但是直到现在FDTD法的在CPU上的计算时...
宋庆增张二路韩冬吕华阳武继刚
关键词:时域有限差分算法中央处理器串行程序
文献传递
共轭梯度求解器的FPGA设计与实现
2011年
针对共轭梯度(CG)迭代算法软件执行效率低、实时性差的缺点,提出一种基于现场可编程逻辑门阵列(FPGA)平台的CG迭代求解器。设计采用软硬件结合的方式构建整个系统,CG协处理器执行CG迭代算法中计算量大、控制简单的代码,以达到硬件加速的目的。控制复杂、计算量较少的代码则依旧在微处理上执行。设计采用行交错数据流,使得整个系统完全无停顿的运行,提高了计算性能。实验结果表明,与软件执行相比,硬件CG协处理器可以获得最高5.7倍的性能加速。
宋庆增顾军华
关键词:可重构计算稀疏线性方程组现场可编程逻辑门阵列共轭梯度法
3D FDTD算法的GPU实现及优化技术研究被引量:1
2015年
FDTD算法是电磁场领域使用非常广泛的数值计算方法,该方法具有很好的精度与灵活性,已成为求解各种电磁场问题的有力工具。半导体技术的快速发展使得CPU的计算性能有了飞跃性的进步,但是直到现在FDTD法的在CPU上的计算时间依旧非常耗时,这极大地限制了FDTD法在各种工程领域里的应用。论文主要在GPU上实现和优化FDTD算法,从而提高FDTD方法的计算效率,节省仿真时间。实验结果表明相对Intel Xeon处理器上执行的串行程序,GPU最高可获得166倍的加速。同时根据Roofline模型,GPU性能达到理论值的89%。
宋庆增张二路韩冬吕华阳武继刚
关键词:FDTD算法CUDAGPU
时域有限差分算法的FPGA加速技术研究被引量:2
2013年
针对各种嵌入式应用中对实时电磁场计算的需求,提出了一种新的时域有限差分法的硬件方法,采用FPGA作为硬件加速部件,加速电磁场时域有限差分算法(FDTD)的计算。采用滤波器技术重新改写时域有限差分法,将时域有限差分法的求解变成对应的硬件滤波器的设计问题,通过设计合适的滤波器完成时域有限差分的计算。实验结果表明,与时域有限差分算法的软件执行相比,硬件实现可以获得5倍左右的性能加速,能够充分发挥FPGA的计算性能。本研究能够进一步扩展时域有限差分算法的应用领域,尤其是扩展到以前因为计算性能无法应用的领域。
宋庆增张金珠武继刚
关键词:现场可编程门阵列时域有限差分法可重构计算
基于FPGA的NoC仿真器的设计与实现被引量:2
2018年
片上网络的设计有很多功耗、面积和性能折中的拓扑结构、缓冲区大小、路由算法和流量控制机制,因此新的NoC设计的研究非常耗时。为了应对这些挑战,提出一种基于快速灵活的FPGA片上网络仿真架构,通过映射虚拟化的NoC组件到一个通用的片上网络仿真引擎上,其基础部件有流量生成器、路由、飞片队列等。并提出基于规则拓扑结构自动生成NoC拓扑结构的设想,且在设计的通用片上网络仿真引擎实施这种设想。实践表明:因为所设计的仿真器是虚拟的,可以模拟任何可用图描述的NoC拓扑结构;任何拓扑结构的片上网络可以映射到机器而无需重建,在一个大型片上网络设计中,用FPGA来实施可以节省很多时间。
王江峰宋庆增张静武继刚
关键词:片上网络仿真器虚拟化自动生成
Xeon Phi协处理器的功耗特征测量与分析
2017年
精确测量和分析Xeon Phi协处理器的功耗特征是实现协处理器功耗管理和优化的基本前提,但准确提取和分析运行在Xeon Phi上并行程序的功耗较为复杂。为此,采用特制的功耗测量设备,完整提取14路供电通道的实时电压和电流,通过计算获得协处理器实时功耗,并在实测数据的基础上分别分析Xeon Phi协处理器启动、空闲、线程和存储系统等的功耗特征。实验结果表明,该功耗模型为功耗优化提供了可信的基础数据,能够指导基于Xeon Phi处理器上的功耗优化。
宋庆增吕华阳赵雷王江峰
关键词:协处理器
改进的求解TSP问题文化蚁群优化方法被引量:10
2010年
在文化算法基础上提出了一种改进的用于求解TSP问题的蚁群优化算法。改进算法采用新的双层进化机制对文化算法的种群空间与信念空间进行了重新设计,用最大最小蚁群系统(MMAS)构建种群空间,在信念空间中对当前最优解进行改进的3-OPT交叉变换操作,由于采用了这种双层进化机制,种群空间获得了更高的进化效率。通过仿真实验结果表明,改进算法比传统的蚁群算法(ACO)、文化蚁群算法(CACS)效果更好,收敛速度更快,精确度更高。
顾军华范培培宋庆增刘恩海
关键词:文化算法旅行商问题
共2页<12>
聚类工具0