公共文化服务平台

2024年7月5日星期五

|

欢迎来到青海省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

宋庆增: 作品数：16 被引量：24H指数：2; 供职机构：天津工业大学计算机科学与软件学院更多>>; 发文基金：天津市应用基础与前沿技术研究计划国家自然科学基金国家教育部博士点基金更多>>; 相关领域：自动化与计算机技术电子电信理学更多>>

合作作者

顾军华河北工业大学计算机科学与软件学...
武继刚广东工业大学计算机学院
王江峰天津工业大学计算机科学与软件学...
李国燕河北工业大学电气工程学院
周博君河北工业大学计算机科学与软件学...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

12篇期刊文章
2篇学位论文
1篇会议论文

领域

12篇自动化与计算...
2篇理学
1篇电子电信

主题

6篇FPGA
4篇硬件
4篇阵列
4篇可重构
4篇可重构计算
4篇处理器
3篇现场可编程
3篇线性方程组
2篇时域有限
2篇时域有限差分
2篇时域有限差分...
2篇稀疏线性方程...
2篇现场可编程门...
2篇协处理
2篇协处理器
2篇门阵列
2篇可编程逻辑
2篇可编程逻辑门...
2篇可编程门阵列
2篇基于FPGA

机构

9篇天津工业大学
9篇河北工业大学
3篇广东工业大学
2篇哈尔滨工业大...
2篇天津理工大学

作者

15篇宋庆增
6篇顾军华
5篇武继刚
2篇周博君
2篇李国燕
2篇王江峰
2篇张二路
1篇侯向丹
1篇刘恩海
1篇王瑞昆
1篇韩冬
1篇张金珠
1篇陆益财
1篇张静
1篇张金珠
1篇薛永江
1篇范培培
1篇赵雷
1篇韩冬

传媒

2篇计算机工程
2篇计算机应用与...
2篇计算机工程与...
1篇计算机工程与...
1篇微电子学与计...
1篇计算机应用
1篇计算机与数字...
1篇现代电子技术
1篇计算机测量与...
1篇2015全国...

年份

1篇2018
1篇2017
3篇2015
4篇2013
4篇2011
1篇2010
1篇2007

共 16 条记录，以下是 1-10

全选清除导出

排序方式：

稀疏磁共振图像重建算法的GPU并行设计与实现被引量：1: 2013年; 基于压缩感知CS(Compressed Sensing)理论的稀疏磁共振图像MRI(Magnetic Resonance Imaging)重构算法包含大量的浮点运算,重构所花费的时间要远远大于傅里叶正反变换重构算法。针对该问题,利用图形处理器GPU(Graphic Processing Unit)强大的并行处理能力,在NVIDIA CUDA(Compute Unified Device Architecture)的框架上对正交匹配追踪OMP(Orthogonal Matching Pursuit)算法进行并行化的设计与实现。实验结果表明,基于GPU实现的算法具有较高的迭代重构速度,对1 0242大小的磁共振图像的重构仅为1.4秒,是CPU实现的24倍,可以满足实际应用对实时性的要求。; 李国燕侯向丹顾军华宋庆增周博君; 关键词：图形处理器统一计算设备架构压缩感知

电磁场数值计算的FPGA加速技术研究: 本文针对各种嵌入式应用中对实时电磁场计算的需求，采用FPGA作为硬件加速器，加速电磁场特定算法（时域有限差分法，时域伪谱法和有限元）的计算。将电磁场数值计算问题（时域有限差分法，时域伪谱法）转换成数字信号处理问题，在FP...; 宋庆增; 关键词：电磁场硬件加速器 FPGA技术; 文献传递

稀疏矩阵向量乘的FPGA设计与实现被引量：3: 2011年; 针对传统的通用处理器(GPP)平台上执行稀疏矩阵向量乘计算效率低的问题,提出一种基于可重构计算平台的SpMXV协处理器设计。方案采用二叉树结构高度流水的数据流、IEEE-754的32 bit浮点数数据格式和对角存储格式。数据通路以流水线方式进行组织,能够优化计算性能。仿真结果表明,与GPP平台上的软件实现相比,通过硬件实现的设计能达到最高2.69倍的性能加速。; 宋庆增顾军华; 关键词：可重构计算协处理器稀疏线性方程组稀疏矩阵向量乘

3D FDTD算法的GPU实现及优化技术研究: FDTD算法是电磁场领域使用非常广泛的数值计算方法,该方法具有很好的精度与灵活性,已成为求解各种电磁场问题的有力的工具.半导体技术的快速发展使得CPU的计算性能有了飞跃性的进步,但是直到现在FDTD法的在CPU上的计算时...; 宋庆增张二路韩冬吕华阳武继刚; 关键词：时域有限差分算法中央处理器串行程序; 文献传递

共轭梯度求解器的FPGA设计与实现: 2011年; 针对共轭梯度(CG)迭代算法软件执行效率低、实时性差的缺点,提出一种基于现场可编程逻辑门阵列(FPGA)平台的CG迭代求解器。设计采用软硬件结合的方式构建整个系统,CG协处理器执行CG迭代算法中计算量大、控制简单的代码,以达到硬件加速的目的。控制复杂、计算量较少的代码则依旧在微处理上执行。设计采用行交错数据流,使得整个系统完全无停顿的运行,提高了计算性能。实验结果表明,与软件执行相比,硬件CG协处理器可以获得最高5.7倍的性能加速。; 宋庆增顾军华; 关键词：可重构计算稀疏线性方程组现场可编程逻辑门阵列共轭梯度法

3D FDTD算法的GPU实现及优化技术研究被引量：1: 2015年; FDTD算法是电磁场领域使用非常广泛的数值计算方法,该方法具有很好的精度与灵活性,已成为求解各种电磁场问题的有力工具。半导体技术的快速发展使得CPU的计算性能有了飞跃性的进步,但是直到现在FDTD法的在CPU上的计算时间依旧非常耗时,这极大地限制了FDTD法在各种工程领域里的应用。论文主要在GPU上实现和优化FDTD算法,从而提高FDTD方法的计算效率,节省仿真时间。实验结果表明相对Intel Xeon处理器上执行的串行程序,GPU最高可获得166倍的加速。同时根据Roofline模型,GPU性能达到理论值的89%。; 宋庆增张二路韩冬吕华阳武继刚; 关键词：FDTD算法 CUDA GPU

时域有限差分算法的FPGA加速技术研究被引量：2: 2013年; 针对各种嵌入式应用中对实时电磁场计算的需求,提出了一种新的时域有限差分法的硬件方法,采用FPGA作为硬件加速部件,加速电磁场时域有限差分算法(FDTD)的计算。采用滤波器技术重新改写时域有限差分法,将时域有限差分法的求解变成对应的硬件滤波器的设计问题,通过设计合适的滤波器完成时域有限差分的计算。实验结果表明,与时域有限差分算法的软件执行相比,硬件实现可以获得5倍左右的性能加速,能够充分发挥FPGA的计算性能。本研究能够进一步扩展时域有限差分算法的应用领域,尤其是扩展到以前因为计算性能无法应用的领域。; 宋庆增张金珠武继刚; 关键词：现场可编程门阵列时域有限差分法可重构计算

基于FPGA的NoC仿真器的设计与实现被引量：2: 2018年; 片上网络的设计有很多功耗、面积和性能折中的拓扑结构、缓冲区大小、路由算法和流量控制机制,因此新的NoC设计的研究非常耗时。为了应对这些挑战,提出一种基于快速灵活的FPGA片上网络仿真架构,通过映射虚拟化的NoC组件到一个通用的片上网络仿真引擎上,其基础部件有流量生成器、路由、飞片队列等。并提出基于规则拓扑结构自动生成NoC拓扑结构的设想,且在设计的通用片上网络仿真引擎实施这种设想。实践表明:因为所设计的仿真器是虚拟的,可以模拟任何可用图描述的NoC拓扑结构;任何拓扑结构的片上网络可以映射到机器而无需重建,在一个大型片上网络设计中,用FPGA来实施可以节省很多时间。; 王江峰宋庆增张静武继刚; 关键词：片上网络仿真器虚拟化自动生成

Xeon Phi协处理器的功耗特征测量与分析: 2017年; 精确测量和分析Xeon Phi协处理器的功耗特征是实现协处理器功耗管理和优化的基本前提,但准确提取和分析运行在Xeon Phi上并行程序的功耗较为复杂。为此,采用特制的功耗测量设备,完整提取14路供电通道的实时电压和电流,通过计算获得协处理器实时功耗,并在实测数据的基础上分别分析Xeon Phi协处理器启动、空闲、线程和存储系统等的功耗特征。实验结果表明,该功耗模型为功耗优化提供了可信的基础数据,能够指导基于Xeon Phi处理器上的功耗优化。; 宋庆增吕华阳赵雷王江峰; 关键词：协处理器

改进的求解TSP问题文化蚁群优化方法被引量：10: 2010年; 在文化算法基础上提出了一种改进的用于求解TSP问题的蚁群优化算法。改进算法采用新的双层进化机制对文化算法的种群空间与信念空间进行了重新设计,用最大最小蚁群系统(MMAS)构建种群空间,在信念空间中对当前最优解进行改进的3-OPT交叉变换操作,由于采用了这种双层进化机制,种群空间获得了更高的进化效率。通过仿真实验结果表明,改进算法比传统的蚁群算法(ACO)、文化蚁群算法(CACS)效果更好,收敛速度更快,精确度更高。; 顾军华范培培宋庆增刘恩海; 关键词：文化算法旅行商问题

全选清除导出

共2页<1 2>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张