针对基于固定变换基的协同稀疏图像压缩感知(CS)重构算法不能充分利用图像自相似特性的问题,提出了一种改进的联合全变差与自适应低秩正则化的压缩感知重构方法。首先,通过图像块匹配法寻找结构相似块,并组成非局部相似块组;然后,以非局部相似块组加权低秩逼近替代协同稀疏表示中的三维小波变换域滤波;最后,结合梯度稀疏与非局部相似块组低秩先验构成重构模型的正则化项,并采用交替方向乘子法求解实现图像重构。实验结果表明,相比协同稀疏压缩感知重构(RCo S)算法,该方法重构图像的峰值信噪比平均可提升约2 d B,所提算法在准确描述图像非局部自相似结构特征的前提下显著提高了重构质量,更好地保留了图像的纹理细节信息。
针对压缩感知系统实时应用的需要,探讨了A*OMP算法的并行设计及基于GPU的加速方法.将耗时长的矩阵逆运算转化为可并行的矩阵/向量操作,并结合算法本身的关联特性,进一步采用迭代法实现以降低其计算复杂度.利用GPU高效的并行运算能力,将算法中可并行的矩阵/向量计算映射到GPU上并行执行,在面向Matlab的Jacket软件平台上对整体串行算法进行了并行化的设计与实现.在NVIDIA Tesla K20Xm GPU和Intel(R)E5-2650 CPU上进行了测试,实验结果表明:对比CPU平台的串行实现,基于GPU的A*OMP算法整体上可获得约40倍的加速,实现了在保持系统较高重构质量的同时能有效降低计算时间,较好地满足了系统实时性的需要.
针对大尺度压缩感知重构算法实时性应用的需要,探讨了基于图形处理器(GPU)的正交匹配追踪算法(OMP)的加速方法及实现。为降低中央处理器与GPU之间传输的高延迟,将整个OMP算法的迭代过程转移到GPU上并行执行。其中,在GPU端根据全局存储器的访问特点,改进CUDA程序使存储访问满足合并访问条件,降低访问延迟。同时,根据流多处理器(SM)的资源条件,增加SM中共享存储器的分配,通过改进线程访问算法来降低bank conflict,提高访存速度。在NVIDIA Tesla K20Xm GPU和Intel(R)E5-2650CPU上进行了测试,结果表明,算法中耗时长的投影模块、更新权值模块分别可获得32和46倍的加速比,算法整体可获得34倍的加速比。