您的位置: 专家智库 > >

黄立波

作品数:174 被引量:36H指数:4
供职机构:国防科学技术大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国防科技大学科研计划项目更多>>
相关领域:自动化与计算机技术电子电信理学交通运输工程更多>>

文献类型

  • 150篇专利
  • 18篇期刊文章
  • 3篇会议论文
  • 2篇科技成果

领域

  • 90篇自动化与计算...
  • 2篇电子电信
  • 1篇交通运输工程
  • 1篇文化科学
  • 1篇理学

主题

  • 71篇处理器
  • 51篇寄存器
  • 27篇微处理器
  • 26篇操作数
  • 20篇硬件开销
  • 17篇队列
  • 16篇乱序
  • 14篇向量
  • 13篇译码
  • 13篇微操作
  • 12篇指令译码
  • 12篇浮点
  • 11篇流水线
  • 11篇缓存
  • 11篇寄存器文件
  • 10篇硬件
  • 10篇寄存
  • 9篇体系结构
  • 8篇映射
  • 8篇请求

机构

  • 173篇国防科学技术...
  • 1篇北京大学
  • 1篇清华大学
  • 1篇中国科学院
  • 1篇华为技术有限...
  • 1篇专用集成电路...
  • 1篇中国科学院大...

作者

  • 173篇黄立波
  • 142篇隋兵才
  • 142篇王永文
  • 137篇孙彩霞
  • 124篇郑重
  • 124篇郭维
  • 121篇雷国庆
  • 120篇王俊辉
  • 112篇倪晓强
  • 101篇郭辉
  • 27篇高军
  • 19篇张承义
  • 19篇窦强
  • 19篇沈俊忠
  • 18篇陈微
  • 15篇王蕾
  • 14篇赵天磊
  • 12篇王志英
  • 9篇马胜
  • 7篇冯权友

传媒

  • 4篇电子学报
  • 3篇计算机科学与...
  • 2篇计算机研究与...
  • 2篇计算机工程与...
  • 2篇计算机工程与...
  • 1篇数学的实践与...
  • 1篇国防科技大学...
  • 1篇计算机工程
  • 1篇小型微型计算...
  • 1篇计算机科学

年份

  • 7篇2024
  • 27篇2023
  • 35篇2022
  • 35篇2021
  • 16篇2020
  • 10篇2019
  • 12篇2018
  • 2篇2017
  • 2篇2016
  • 5篇2015
  • 4篇2014
  • 8篇2013
  • 5篇2012
  • 1篇2010
  • 1篇2009
  • 1篇2008
  • 1篇2007
  • 1篇2006
174 条 记 录,以下是 1-10
排序方式:
一种可配置的多进多出FIFO的设计方法及装置
本发明公开了一种多进多出FIFO,包括控制单元fifo_ctl和数据存储单元fifo_dp,控制单元fifo_ctl的输出端和数据存储单元fifo_dp之间连接有信号wren、读指针rptr和写指针wptr一共三组信号,...
王俊辉孙彩霞郑重郭维郭辉雷国庆隋兵才黄立波冯权友倪晓强王永文
一种原子指令的执行方法和装置
本发明公开了一种原子指令的执行方法和装置,本发明方法包括将原子指令发送到Store流水线执行;非Cache一致性区域操作的原子指令发送到下一级存储中,并等待返回结果;Cache一致性区域的原子指令在Store流水线中获取...
郑重黄立波隋兵才王永文倪晓强孙彩霞王俊辉雷国庆郭维郭辉
文献传递
一种向量聚合装载指令的实现方法
本发明涉及微处理器设计技术领域,具体涉及一种向量聚合装载指令的实现方法,步骤包括:将向量聚合装载指令拆分为多个单元素的普通装载微操作;将拆分后微操作及相应的元素序号发往指令队列中;操作数准备好后,将单元素装载微操作发往存...
郑重王永文孙彩霞王俊辉隋兵才倪晓强雷国庆黄立波郭维郭辉
文献传递
运行时程序安全关键数据的完整性验证方法及装置
本发明公开了一种运行时程序安全关键数据的完整性验证方法及装置,方法步骤如下:1)在程序中指明安全关键变量,在编译时生成安全关键数据集合,加载程序时将程序的虚拟地址空间分为保护区域和非保护区域、将安全关键数据集合加载至保护...
王蕾邓宇王永文窦强李姗姗孙彩霞张承义高军黄立波倪晓强隋兵才陈微赵天磊
文献传递
面向现代GPU的Winograd卷积加速研究
2024年
卷积运算是现代卷积神经网络中必不可少的组成部分,同时也是最耗时的.为了解决卷积算子的性能问题,包括快速傅里叶变换(Fast Fourier Transform,FFT)和Winograd在内的快速卷积算法被提出. Winograd卷积可被用于提高小卷积核的推理性能,是目前卷积神经网络中的主流实现方法 .然而,Winograd卷积在许多高度优化的深度神经网络库和深度学习编译器中的实现比较低效.由于Winograd卷积的四个阶段的复杂数据依赖关系,面向GPU对其进行优化非常具有挑战性.本文针对现代GPU体系结构优化了Winograd卷积算子的性能.本文提出了Winograd计算阶段的等价变化及其利用Tensor Core进行计算的无同步实现,并进一步提出了利用不同GPU内存层级的部分计算核融合方法 PKF(Partial Kernel Fusion).基于张量虚拟机(Tensor Virtual Machine,TVM)和代码重构器PKF-Reconstructor(Partial Kernel Fusion Reconstructor),实现了高性能的Winograd卷积.对真实应用中卷积神经网络的卷积算子的评估表明,与cuDNN相比,本文所提算法实现了7.58~13.69倍的性能提升.
童敢黄立波吕雅帅
基于图形处理器的图计算边向量负载平衡方法及装置
本发明公开了一种基于图形处理器的图计算边向量负载平衡方法及装置,本发明方法包括定期找出所有SM核需要处理的边数据中的最多的和最少的数据量并计算差值,且差值超过预设阈值两个SM核的状态分别设置为等待捐赠负载状态和接收负载捐...
黄立波郭辉郑重郭维雷国庆王俊辉隋兵才孙彩霞王永文倪晓强
文献传递
兼容SIMD计算和浮点矩阵乘法的运算部件及其应用方法
本发明公开了一种兼容SIMD计算和浮点矩阵乘法的运算部件及其应用方法,运算部件包括可复用操作数堆的浮点和向量执行部件vfu0和vfu1,所述浮点和向量执行部件vfu0和vfu1均包括四个呈阵列状布置的乘加部件,四个乘加部...
邓全邱哲豪王永文隋兵才孙彩霞倪晓强黄立波郑重雷国庆王俊辉郭维郭辉
文献传递
一种分支目标预测地址在流水线中的传递方法和装置
本发明公开了一种分支目标预测地址在流水线中的传递方法及装置,本发明方法包括初始化预测地址队列的读写指针和队列空闲项数寄存器;在取指阶段,根据分支方向预测结果,将预测跳转的分支的目标预测地址写入预测地址队列,并更新队列写指...
孙彩霞邓全郭辉郭维雷国庆王俊辉郑重倪晓强黄立波隋兵才王永文
多通道与非型快闪并行存储控制器
本发明公开了一种多通道与非型快闪并行存储控制器,目的是提供一种能提供更高聚合带宽,数据读写可靠性高的存储控制器。本发明由交换结构模块和n个底层存储控制器组成,交换结构模块由请求队列、传输仲裁部件和交叉开关组成,对多通道的...
肖侬赖明澈黄立波刘芳陈志广欧洋
文献传递
一种防范分支历史注入攻击的方法和装置
本发明公开了一种防范分支历史注入攻击的方法和装置,本发明防范分支历史注入攻击的方法包括为每一个特权级设置一个仅供该特权级单独使用的分支历史缓冲;当程序在某个特权级运行时,分支预测部件使用当前特权级所对应的分支历史缓冲进行...
郑重黄立波隋兵才郭辉郭维孙彩霞王永文倪晓强雷国庆王俊辉邓全沈俊忠
共18页<12345678910>
聚类工具0