国家高技术研究发展计划(2009AA011702)
- 作品数:5 被引量:14H指数:3
- 相关作者:尹首一魏少军刘雷波殷崇勇朱敏更多>>
- 相关机构:清华大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 一种CABAC解码引擎的芯片实现被引量:2
- 2013年
- CABAC(Context-based Adaptive Binary Arithmetic coding)是H.264中所采用的一种高效熵编码,压缩率高,但结构复杂,硬件实现难度大。本文在P.Zhang 2008年的工作[1]基础上提出一种单周期CABAC解码引擎的优化实现方法,通过查表替换、分支预测、逻辑调整、反相器优化等关键路径优化方法和寄存器精简等面积优化方法进一步提高了解码性能。经过芯片验证,CABAC解码引擎性能提高到250Mbps,面积减少46%,峰值工作情形下功耗1.03mW,满足下一代视频编解码协议(QFHD)的需求。
- 朱敏刘雷波王星殷崇勇尹首一魏少军
- 关键词:CABACH
- 可重构媒体处理器配置信息优化生成技术被引量:1
- 2012年
- 为降低可重构媒体处理器任务编译器设计中系统配置代价,有效提升配置信息的配置效率,提出了一种新的配置信息优化生成方法。该生成方法在对输入的数据流图进行独立子图搜索和子图同构判定得到各类子图的属性的基础上,对配置模板生成步骤增添约束来生成全等的配置模板以提升系统的配置性能。本文方法已被应用到可重构媒体处理器任务编译器的设计实践中。实验结果表明:本文方法能够有效地生成优化的配置信息,所生成的配置信息的配置性能明显优于传统贪婪方法生成的配置信息。
- 殷崇勇尹首一魏少军
- 关键词:电子技术可重构计算媒体处理器子图同构
- 可重构媒体处理器任务编译器的前端设计被引量:3
- 2011年
- 为了解决算法程序自动映射到可重构媒体处理器的问题,有效提高程序并行执行的效率,提出一种具有自动并行化的任务编译前端.该任务编译前端通过展开核心循环可提高并行执行度,在数据依赖分析确保运算正确执行的基础上,对循环体内的数组访问进行标量替换,以优化数据传输开销.实验结果表明,该任务编译前端能有效提高代码并行性和优化数据传输能力,与Garp C编译器的编译前端相比,该任务编译前端设计的性能可提升约2~4倍.
- 殷崇勇尹首一刘雷波杨超朱敏魏少军
- 关键词:可重构计算
- 基于可重构处理器的并行优化算法被引量:3
- 2012年
- 为挖掘可重构处理器的内在并行性,需要编译器通过分析程序的并行性来决定可重构处理器硬件最好的执行模式。为此,提出一种基于可重构处理器的并行优化算法。将有向无环图的并行计算部分映射到可重构处理器上,对任务实现3个不同层次的并行性(指令级并行、循环级并行、线程级并行)。测试结果表明,该算法使得可重构处理器在处理任务时比未用并行优化算法的性能提升1.2倍左右。
- 刘石柱尹首一殷崇勇刘雷波魏少军
- 关键词:可重构处理器并行处理有向无环图
- 基于多层AHB架构的多核SoC设计被引量:5
- 2012年
- 设计并实现一个基于多层AHB架构的多核异构片上系统。以ARM和DSP处理器为核心,对控制密集型任务和计算密集型任务进行合理分配并高效执行。采用分布式存储和共享存储相结合的存储器配置方案,保证数据完整性与程序并行性。利用基于多层AHB的开关矩阵结构,使不同主设备在不竞争同一个从设备时可并行访问总线。实验结果表明,该系统的资源消耗和延迟较小,可支持较大的网络带宽。
- 刘继尧刘雷波尹首一魏少军
- 关键词:多核片上总线片上系统片上通信