搜索到297篇“ 单精度“的相关文章
- 基于RISC-V指令拓展的单精度可配置矩阵运算单元的处理系统
- 本发明涉及集成电路技术领域,具体是基于RISC‑V指令拓展的单精度可配置矩阵运算单元的处理系统,包括用于执行软件程序以及识别自定义扩展指令的RISC‑V处理器,通过自定义协处理器接口与单精度可配置矩阵运算单元连接;单精度...
- 刘佳郡王宇实陈睿晓贡力邹卓
- 一种可编程电路单精度浮点数开平方方法
- 本发明涉及电子信息技术领域,具体公开了一种可编程电路单精度浮点数开平方方法,定义系数常数,变量初始化;输入参数V,对参数V的正负进行判断,并确定参数V是否为0或1;提取参数V的尾数与指数,判断指数是否大于或等于127;按...
- 罗国平
- 基于Atlas800服务器平台的单精度矩阵乘法计算方法
- 本发明公开一种基于Atlas800服务器平台的单精度矩阵乘法计算方法,包括以下步骤:将计算任务均匀分配给Atlas800服务器NPU的各个计算核心进行并行计算;从全局内存按照预设数据排布方式读取两个待相乘的单精度矩阵;调...
- 陈昀陆璐
- 数据处理用双通道并行单精度浮点数据格式的加速方法
- 本发明公开了数据处理用双通道并行单精度浮点数据格式的加速方法,包括分别构建配置通道以及构建数据通道,对当前目标数据进行处理,以与配置通道形成并行处理结构,减少系统目标任务处理时间;预设目标数据处理流程;待配置通道接收到当...
- 钱家祥 石小刚 黄光新
- 单精度浮点运算装置
- 本发明提供一种单精度浮点运算装置,涉及浮点运算技术领域,包括:控制器,用于确定向至少一个处理单元输入的输入信息,其中,输入信息包括输入数据和操作指令;处理单元组,包括多个处理单元,每个处理单元用于根据操作指令对输入数据进...
- 陈松段飞祥游宇航倪小兵康一
- 基于共享浮点数型的单精度浮点数量化方法
- 本发明公开了一种基于共享浮点数型的单精度浮点数量化方法,用于支持浮点型存内计算单元的加速器(宏单元)设计,该方法提出了一种共享浮点(ShareFloat)数据类型,并设计了将单精度浮点数量化成ShareFloat的方法,...
- 司鑫郭安陈禧
- 基于FT2000+的单精度低阶矩阵乘分块算法优化方法及系统
- 本发明提供了一种基于FT2000+的单精度低阶矩阵乘分块算法优化方法及系统,包括:步骤S1:针对雷达向量类函数,利用NEON汇编建立向量加速模型;步骤S2:利用SIMD向量化,实现雷达信息数据并行;步骤S3:基于SIMD...
- 章诗琪张矩
- 针对SW26010众核处理器的单精度矩阵乘算法
- 2023年
- 矩阵乘作为许多科学应用中被频繁使用的关键部分,其计算量巨大且稠密的本质,使得高性能计算领域中矩阵乘并行算法的研究一直是经久不衰的热门话题.随着我国自主研发的申威众核处理器SW26010在科学计算和人工智能领域的快速发展,对面向SW26010众核处理器的高性能矩阵乘算法提出了迫切的需求.针对SW26010众核处理器的体系结构特征,首次对单精度矩阵乘实现进行了深入探讨,提出了3种不同存储层次的高性能并行算法.在进行算法设计时,计算方面,结合该处理器的从核双流水,从汇编层面手动控制核心计算任务的指令序列,保证了高效的指令级并行;访存方面,综合考虑了有限片上存储资源的有效使用,以及访存任务和计算任务的交叉并行,实现了计算访存的平衡以及算法整体性能的提升.实验结果显示,与该处理器上最先进的官方数学库xMath中的单精度矩阵乘实现相比,运行时峰值性能提升了6.8%,达到了理论峰值性能的86.17%;在基于不同矩阵乘场景的通用性比较中,95.33%的场景中性能更高,最高性能加速比达到247.9%,平均性能加速比为61.66%.
- 武铮许乐安虹金旭文可
- 关键词:矩阵乘计算机系统结构
- 一种SAR型ADC的简单精度测量方法
- 本发明属ADC(模拟数字转换器)领域,尤其涉及一种SAR型ADC的简单精度测量方法,包括恒压源、电容、电阻、被测ADC模块、MCU模块、上位机;电阻一端连接恒压源“+”端,电阻另一端连接被测ADC模块;电容一端连接到电容...
- 杨鹏飞梁云飞韩玉王利峰
- 一种基于单精度浮点数据的核电厂燃耗计算方法
- 一种基于单精度浮点数据的核电厂燃耗计算方法,可在线进行燃耗实时跟踪、计算。包括以下步骤S1:计算核电厂燃耗;S2:继续化简得到如下公式:<Image file="DDA0003573499370000011.GIF" h...
- 孟凡锋蔡光明李振振郑东佳耿飞肖冰山杨浩陈伟
相关作者
- 沈海斌

- 作品数:331被引量:599H指数:12
- 供职机构:浙江大学
- 研究主题:低功耗 支持向量机 随机数发生器 可重构 寄存器
- 刘衡竹

- 作品数:161被引量:190H指数:7
- 供职机构:国防科学技术大学
- 研究主题:向量 向量处理器 SIMD 矩阵 寄存器文件
- 李国兵

- 作品数:163被引量:48H指数:4
- 供职机构:西安交通大学
- 研究主题:基站 波束 预编码 导频 用户
- 魏星

- 作品数:21被引量:13H指数:2
- 供职机构:中国科学院电子学研究所
- 研究主题:延时 级数 或非门 网络 乘法运算
- 何颂颂

- 作品数:15被引量:30H指数:4
- 供职机构:中国科学技术大学计算机科学与技术学院
- 研究主题:龙芯3A 矩阵乘法 P2P BLAS 资源密度