您的位置: 专家智库 > >

“核心电子器件、高端通用芯片及基础软件产品”国家科技重大专项(2012ZX01034-00-001)

作品数:4 被引量:3H指数:1
相关作者:郑启龙沈旭东范守科夏海军黄胜兵更多>>
相关机构:中国科学技术大学安徽省高性能计算重点实验室合肥市公安局更多>>
发文基金:国家科技重大专项国家科技支撑计划安徽省科技攻关计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 2篇DSP
  • 2篇超长指令字
  • 1篇单指令多数据
  • 1篇优化算法
  • 1篇人脸
  • 1篇人脸检索
  • 1篇神经网
  • 1篇神经网络
  • 1篇神经网络模型
  • 1篇树匹配
  • 1篇网络
  • 1篇网络模型
  • 1篇谓词
  • 1篇谓词执行
  • 1篇向量
  • 1篇向量化
  • 1篇卷积
  • 1篇卷积神经网络
  • 1篇架构
  • 1篇哈希

机构

  • 4篇中国科学技术...
  • 2篇安徽省高性能...
  • 1篇中国电子科技...
  • 1篇合肥市公安局
  • 1篇中国人民解放...

作者

  • 3篇郑启龙
  • 1篇耿锐
  • 1篇苏金波
  • 1篇王昊
  • 1篇王向前
  • 1篇黄胜兵
  • 1篇夏海军
  • 1篇范守科
  • 1篇沈旭东

传媒

  • 4篇计算机系统应...

年份

  • 2篇2016
  • 1篇2015
  • 1篇2013
4 条 记 录,以下是 1-4
排序方式:
带相关反馈的基于深度神经网络模型的人脸检索方法
2016年
针对大规模人脸检索问题,提出了一种带相关反馈的基于深度神经网络模型的人脸检索方法.首先利用卷积神经网络对人脸进行特征提取,再利用传统的检索方法进行人脸检索,在检索环节之后加入相关反馈环节.根据用户反馈的结果,将样本分成正例和负例,作为反馈环节的训练样本,完成反馈环节的训练.实验表明,该方法能够显著提高人脸检索的准确率.
沈旭东范守科夏海军苏金波
关键词:人脸检索卷积神经网络
BWDSP10x上地址和数据谓词执行的编译优化
2016年
传统的谓词优化技术是在冯·诺伊曼体系结构计算机上实施的,仅对数据流进行优化,并没有考虑哈佛体系结构下指令和数据分开的情况.BWDSP10x是指令和数据分开的哈佛体系结构,它支持超长指令字,不仅提供了对数据谓词执行的支持也提供了对地址谓词执行的支持.特此提出了一种在区域上对两种谓词模式优化支持的方法,在进行两种比较之前,通过判断比较操作的两个操作数类型来分别实施两种模式的谓词优化,使得对地址的比较不用传输到通用寄存器中.实验结果表明该优化方法能显著地节省CPU的时间和带宽,大大减少了分支指令,使程序性能提高了28.4%.
樊永朝郑启龙耿锐王向前王昊
面向多簇超长指令字DSP的向量化优化算法被引量:3
2013年
BWDSP是一款针对高性能计算领域设计的处理器,采用多簇超长指令字(VLIW)体系结构和SIMD架构,同时也提供了很多向量化指令.然而现有的编译框架无法对这些向量化指令提供支持,因此本文提出了一种向量化优化算法,可以显著提高一些在DSP领域有着广泛应用的计算密集型程序的性能.最终实验结果表明,该优化算法能够平均取得6.60倍的加速比.
徐华叶郑启龙丁陈飞徐东鹏
关键词:超长指令字
面向多簇架构DSP的树匹配向量化算法
2015年
BWDSP是针对高性能计算设计的一款新型的处理器,采用多簇超长指令字体系结构和SIMD架构,有丰富的指令集.为充分利用BWDSP提供的向量化资源,迫切需要提出一种向量化算法.本文在open64基础上研究并实现了面向多簇超长指令字(VLIW)DSP的SIMD编译优化算法.算法基于OPEN64的中间语言WHIRL,能够充分地利用BWDSP丰富的硬件资源和向量化指令.最终实验结果表明,对于能够合成双字和单字的循环程序,该优化算法能够平均取得6倍和4倍的加速比.
郭连伟郑启龙黄胜兵徐华叶
关键词:单指令多数据超长指令字
共1页<1>
聚类工具0