许勇
- 作品数:47 被引量:3H指数:1
- 供职机构:江南计算技术研究所更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- Cache一致性协议派生处理方法
- 本发明提供了一种Cache一致性协议派生处理方法。针对每一个一次请求的一致性处理流程依次执行目录访问以及派生请求判断;在目录访问中,查询一次请求地址对应的数据在CPU内部是否有比主存更新的副本,如有,则一次请求访问最新副...
- 郑卫华王梦嘉张清波许勇郑方高红光
- 文献传递
- 一种采用RISC架构的CPU系统
- 本发明提供一种直接支持64个结构寄存器的RISC指令集编码格式,属于计算机体系结构和处理器微结构技术领域。该直接支持64个结构寄存器的RISC指令集编码格式中,所有指令编码保持32位定长,编码字段包括结构寄存器索引字段R...
- 高剑刚高红光过锋李宏亮郑方许勇张昆杨萱
- 文献传递
- 运算核心及其指令管理方法
- 一种运算核心及其指令管理方法,所述运算核心的指令管理方法包括:接收并储存指令块的指令,所述指令块为预送的;运行所述存储的指令块的指令。本发明的技术方案有效的减少了运算核心的指令脱靶和等待延迟,提高了运算核心的计算效率。
- 高剑刚郑方许勇高红光过锋任秀江赵鸿昌
- 文献传递
- 寄存器写冲突检测方法及装置、以及处理器
- 本发明提供了一种寄存器写冲突检测方法及装置、以及处理器。初始地对写有效队列进行重置。获取所述指令的指令执行延迟。读取写有效队列中与处于指令准备发射状态的指令的指令执行延迟等时长的队列位置的写有效位值。判断所读取的写有效队...
- 过锋许勇任秀江高红光郑方唐勇施晶晶
- 文献传递
- 一种处理器阵列局部存储混合管理方法
- 本发明提供一种处理器阵列局部存储混合管理技术,属于计算机体系结构和处理器微结构技术领域。该处理器阵列局部存储混合管理技术包括如下步骤:S1:将阵列处理器中每个核心的片上局部存储(LDM)被划分为第一类区域、第二类区域和第...
- 高剑刚施晶晶李宏亮过锋唐勇吴铁彬郑方许勇
- 文献传递
- 支持请求响应多端口异步多播的高吞吐混合仲裁路由机制
- 本发明提供支持请求响应多端口异步多播的高吞吐混合仲裁路由机制,属于计算机体系结构与芯片微结构技术领域。该支持请求响应多端口异步多播的高吞吐混合仲裁路由机制包括如下步骤:S1:处理器发出的单FLIT请求/响应包在仲裁过程中...
- 丁亚军严忻恺唐勇杨萱陈正博高红光许勇王迪
- 文献传递
- 卷积核归一化被引量:2
- 2019年
- 批量归一化已被证明是深度学习模型中不可或缺的一层,可以有效处理深度神经网络训练过程中的内部协方差位移问题。但批量归一化算法的效果依赖于批的大小,当批较小时,批量归一化的效果较差。此外,批量归一化也带来了额外的计算量,需要更多的存储空间。为了解决这些问题,文中提出一种新的归一化算法——卷积核归一化,对权重的输出通道进行归一化,同样可以有效解决内部协方差位移问题。卷积核归一化不依赖于批的大小,并且不需要计算输入的均值和方差,相比批量归一化减少了75%至81%的计算量。实验证明,在批较小的时候,卷积核归一化训练收敛速度较快且准确率较高,比批量归一化高0.9%至12%;在批较大的时候,卷积核归一化与批量归一化最高准确率误差不超过1%。
- 王迪许勇李宏亮郝子宇
- 关键词:卷积神经网络
- 一种直接支持64个结构寄存器的RISC指令集编码格式
- 本发明提供一种直接支持64个结构寄存器的RISC指令集编码格式,属于计算机体系结构和处理器微结构技术领域。该直接支持64个结构寄存器的RISC指令集编码格式中,所有指令编码保持32位定长,编码字段包括结构寄存器索引字段R...
- 高剑刚高红光过锋李宏亮郑方许勇张昆杨萱
- Cache一致性协议派生处理方法
- 本发明提供了一种Cache一致性协议派生处理方法。针对每一个一次请求的一致性处理流程依次执行目录访问以及派生请求判断;在目录访问中,查询一次请求地址对应的数据在CPU内部是否有比主存更新的副本,如有,则一次请求访问最新副...
- 郑卫华王梦嘉张清波许勇郑方高红光
- 文献传递
- 高性能处理器运算部件自检错技术研究
- 随着高性能计算机系统的规模越来越大,对处理器可靠性的要求越来越高。然而,随着技术的发展,单处理器芯片的软错误率呈上升趋势。本文对适用于高性能处理器运算部件的自检错技术进行了分析,从检错覆盖率和面积开销两方面做了详细的比较...
- 周建毅许勇郑方李宏亮
- 关键词:软错误