马占刚
- 作品数:5 被引量:2H指数:1
- 供职机构:北京大学软件与微电子学院更多>>
- 相关领域:自动化与计算机技术电气工程更多>>
- 一种SHA2硬件加速器的设计方法
- 2022年
- 针对SHA2硬件吞吐率难以提升的问题,提出一种提升SHA2硬件加速器性能的新方案。1)使用4 Kb的乒乓缓存存储填充好的消息块,使消息填充单元和哈希迭代运算单位两部分硬件电路得以两级流水并行处理。2)在哈希迭代运算中,提取对两轮哈希迭代运算没有依赖性的计算作为预处理,使之与迭代运算的后处理部分形成真正的流水线处理,可以避免以往研究中的伪流水线问题。3)预处理和后处理部分均采用无进位链的3:2压缩器/4:2压缩器和快速加法器等电路,使关键路径明显变短,关键路径延迟明显变小。该方案还支持SHA2双哈希计算:直接对源操作数的摘要进行第二次哈希计算,得到双哈希计算的最后结果,减少外部存储器的访问次数和数据处理,从而提升SHA2双哈希计算的处理速度。
- 马占刚李婷婷曹喜信
- 关键词:硬件加速器
- 脑机游戏硬件平台综述
- 2022年
- 硬件平台对促进脑机游戏不断往前发展起到重要作用。本文从脑机接口技术处理流程和脑电信号分类算法的角度综述脑机游戏硬件平台的研究进展,根据脑机游戏复杂度,研究了在线硬件平台和离线硬件平台,提出了对硬件平台进行功耗管理的方法。
- 马占刚李婷婷曹喜信
- 关键词:硬件平台
- 基于以太坊的专利溯源系统的设计与实现
- 2020年
- 区块链技术是一种全新的分布式存储技术,具有去中心化、防篡改、可信溯源的特性,传统专利系统是中心化的存储模式,数据安全高度依赖中心服务器,同时审批效率低,运行成本高。针对已有专利系统存在的问题,选择以太坊作为开发平台,构建多节点集群,通过同步节点数据的一致性和完整性,设计一种去中心化的专利溯源系统,实现信息上链、授权、转让、溯源4个功能,为专利系统提供更高的效率、安全和更低的成本。
- 李春雷马占刚曹喜信
- 关键词:区块链
- 一种可扩展的区块链专用协处理器架构
- 2020年
- 随着区块链技术的发展,区块链系统对区块链底层的密码学算法等复杂运算的处理速度要求越来越高。双重哈希、默克尔树中哈希函数的连续计算、混合加密算法的组合运算等是区块链系统中经常出现的底层运算。为了处理这些运算,处理器频繁地访问寄存器和存储器,会使外设对总线的竞争加剧,随之引起延时变长和性能降低。为了解决这一问题,提出了一种可扩展的区块链专用协处理器架构:(1)内置的指令缓存和数据缓存使获得数据的路径变短,进而加快了处理速度;同时,外设对总线的竞争也有所缓解。(2)取指路径和取数路径都采取流水线方式,使数据处理可以不间断地工作,也会提升处理速度。(3)哈希计算单元支持双重哈希和多重哈希的计算,避免了计算的中间数据访问存储器和缓存,也使双重哈希和多重哈希的计算速度加快。还对区块链专用协处理器架构扩展到其他密码学算法、图像处理算法、神经网络算法等的可能性做了探讨。
- 马占刚李春雷曹喜信
- 关键词:区块链协处理器可扩展性
- 基于YOLOv3的神经网络模型压缩与实现被引量:2
- 2020年
- 目标检测是计算机视觉的一个重要分支,随着深度学习的发展,目标检测也取得了不错的研究成果。目前,基于深度学习的目标检测算法一般采用卷积神经网络,具有很强的自主学习能力并且能够处理相对复杂的数据信息,在图像分类与定位上效果显著。YOLO系列算法是现在比较流行的基于深度学习的目标检测算法,其采用一种端到端的思想,通过一个网络模型同时实现目标的分类和定位。YOLOv3在图片特征提取部分采用53层的卷积神经网络,并在网络结构中加入了残差结构,在提高物体识别准确率的同时增加了模型复杂度,使网络开销变大,这对硬件平台的要求很高。为了解决硬件平台内存消耗过高问题,提出一种改进的目标检测网络结构,核心思想是将网络模型进行裁剪,对裁剪后的模型进一步修整并压缩骨干网络形成一种轻量级的神经网络,可以使模型的规模显著减小。实验结果表明,压缩后的网络模型减小为原始模型的13%,降低了对硬件平台的要求。
- 张亚平吴绩伟马占刚曹喜信郭文海
- 关键词:目标检测卷积神经网络