搜索到373篇“ 快速卷积“的相关文章
基于张量虚拟机的快速卷积自动性能优化被引量:1
2024年
卷积神经网络作为深度学习的典型代表,是计算机视觉等任务中最常用的神经网络,然而,卷积运算通常占整个卷积神经网络运行时的90%以上,成为卷积神经网络的性能瓶颈。此外,由于当下硬件的复杂性及工作负载的多样性,之前工作中的一些特定优化往往缺乏性能可移植性。对此,作者提出BlazerML,一个基于张量虚拟机(TVM)模板代码自动生成的开源卷积计算库,可为任何输入形状自动生成高性能的卷积实现。BlazerML是基于Winograd算法实现的,因为该算法是快速卷积算法中性能最高的算法。实验结果表明:BlazerML显著优于当下最先进的开源库。在x86 CPU上运行常见的深度学习网络前向推理分别比OnnxRuntime、MNN和TVM社区版本快1.18~2.47倍、1.18~2.27倍和1.01~1.66倍。在ARMCPU上运行常见深度学习网络的单层推理分别比ACL和FastConv快1.26~6.11倍、1.04~4.28倍。
陈疆朱泓霖孟金涛魏彦杰
关键词:卷积神经网络
基于实数FFT及IFFT快速卷积的CNN推理架构设计方法
本申请涉及一种基于实数FFT及IFFT快速卷积的CNN推理架构设计方法。所述方法通过变换卷积的计算域降低计算复杂度以提升卷积计算实时性及效率,进而提升CNN推理过程的计算实时性及效率;采用实数FFT变换和IFFT变换实现...
杨志玺 叶淦华 刘思力李献斌 吕蓉杨俊 谢世珺 崔璨 张煜锋 王永刚
基于实数FFT及IFFT快速卷积的低资源消耗CNN推理架构设计方法
本申请涉及一种基于实数FFT及IFFT快速卷积的低资源消耗CNN推理架构设计方法。所述方法通过变换卷积的计算域降低计算复杂度以提升卷积计算实时性及效率,进而提升CNN推理过程的计算实时性及效率;采用实数FFT变换和IFF...
杨志玺 叶淦华 刘思力李献斌 吕蓉杨俊 谢世珺 崔璨 张煜锋 王永刚
一种基于可变形快速卷积的光伏组件缺陷识别方法
本发明公开了一种基于可变形快速卷积的光伏组件缺陷识别方法,包括如下步骤:S1:将图像输入Ghost卷积神经网络,通过Ghost卷积神经网络提取图像的特征;S2:通过C2f模块将不同尺度的特征图进行融合;S3:为了更好地适...
代钦高英才王洪江沈庆泽刘芳
面向飞腾处理器平台的快速卷积算法优化
2024年
为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中的访存效率。配合分块方案设计实现高性能的矩阵乘法微内核,使用向量外积运算更新数据,提高计算访存比,实现最大程度掩盖访存指令的延迟。最终实验结果表明,FastInfer在FT-2000/4处理器上的峰值计算性能达到99.56 GFLOPS。在不同输入规模的通用矩阵乘法测试中,FastInfer性能是OpenBLAS算法的1.07倍和1.52倍。在卷积测试中,FastInfer性能是ARM Compute Library算法的1.32倍,实现了在FT-2000/4多核处理器上的高性能卷积计算。
赵亚飞杨耀功王永刚魏继增
关键词:并行计算
基于轻量化快速卷积与双向加权特征融合网络的船舶裂纹检测
2024年
[目的]针对人工目视与超声波方法的船舶裂纹检测存在效率低下、成本高昂和危险性高的特点,提出一种基于深度学习的船舶裂纹检测方法。[方法]首先,在原模型YOLOv5s的主干网络中使用轻量化卷积结构(GSConv)替代标准卷积并融入注意力机制,在降低主干网络参数量与计算量的同时,提升主干网络对裂纹特征的提取能力;然后,在网络的颈部使用基于PConv构建的C3_Faster替代原C3模块,提升模型的图像处理速度,增强模型快速性;最后,设计一种简化的双向加权特征融合网络(BiFFN)以改进原模型YOLOv5s中的特征聚合网络,提升裂纹的语义信息与位置信息的融合效果,以及模型对裂纹的识别准确度与定位精度。[结果]通过对船舶裂纹原始数据与增强数据的学习,所提改进模型实现了94.11%的检测精度和93.50%的召回率,模型的计算量降低了17.93%,参数量降低了15.81%。[结论]研究表明,基于轻量化快速卷积与双向加权特征融合网络(MLF-YOLO)的船舶裂纹检测方法,实现了模型轻量化与较高的检测精度和召回率,结果可为开发自主无人机船舶检测提供参考。
王冲朱玉辉
基于符号同步的连续快速卷积的处理
根据一个方面,提供了一种装置,该装置包括用于执行以下各项。该装置接收由无线电发送器或收发器的至少一个正交频分复用调制器产生的正交频分复用符号和相关联的循环前缀的流。该装置将上述流划分为第一长度的多个重叠处理块。多个重叠处...
T·勒瓦南J·雅丽-卡基南
一种基于快速卷积近场动力学算法的岩石裂纹扩展模拟方法
本发明公开了一种基于快速卷积近场动力学算法的岩石裂纹扩展模拟方法,包括几何模型的建立;模型的网格划分;将网格划分后得到的模型单元节点数据导出并删除除节点坐标以外的所有内容,得到第一二维或三维几何模型数据;基于alpha ...
廖星川周建刘福深尚肖楠沈君逸
一种快速卷积方法及系统
本说明书实施例提供了一种快速卷积方法及系统,其中,方法包括:通过图像采集设备采集D张空间尺寸为H,W的图像,将其堆叠为形状为D*H*W的三维体;将所述三维体变换为形状为B*C*D*H*W的五维张量,其中B表示网络单次运行...
金满昌 卢志 李琦
基于卷积核分解-Winograd快速卷积算法的地震波场模拟方法
基于卷积核分解‑Winograd快速卷积算法的地震波场模拟方法,本发明为了解决大规模地震波场模拟中卷积运算效率低的问题。地震波场高效模拟方法:一、建立空间差分和卷积的本征联系;二、建立F(3,2)卷积的Winograd加...
籍多发李晨曦翟长海

相关作者

王光宇
作品数:62被引量:84H指数:6
供职机构:重庆邮电大学通信与信息工程学院
研究主题:滤波器组 调制系统 正交频分复用 频谱效率 索引
邵凯
作品数:83被引量:81H指数:4
供职机构:重庆邮电大学通信与信息工程学院
研究主题:正交频分复用 滤波器组 原型滤波器 调制系统 多载波
虞湘滨
作品数:7被引量:28H指数:3
供职机构:河海大学计算机及信息工程学院
研究主题:快速卷积 低压电力线 MALLAT算法 数字信号处理 快速傅立叶变换
曹宁
作品数:217被引量:329H指数:8
供职机构:河海大学
研究主题:图像 H.264 H.26L H.263 仿真方法
刘建国
作品数:157被引量:470H指数:9
供职机构:华中科技大学
研究主题:化学镀 糖尿病肾病 肾纤维化 激光 血竭素高氯酸盐