您的位置: 专家智库 > >

国家自然科学基金(61100013)

作品数:3 被引量:5H指数:1
相关作者:宋风龙张轮凯王达范灵俊郑亚松更多>>
相关机构:中国科学院中国科学院研究生院中国矿业大学(北京)更多>>
发文基金:国家自然科学基金创新研究群体科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇缓存
  • 1篇动态功耗
  • 1篇视频
  • 1篇视频编码
  • 1篇组相联
  • 1篇无效
  • 1篇细粒度
  • 1篇细粒度并行
  • 1篇末级
  • 1篇功耗
  • 1篇共享
  • 1篇归一化
  • 1篇核结构
  • 1篇高速缓存
  • 1篇LFU
  • 1篇并行计算
  • 1篇不匹配
  • 1篇处理器

机构

  • 3篇中国科学院
  • 2篇中国科学院研...
  • 1篇中国矿业大学...

作者

  • 2篇张轮凯
  • 2篇宋风龙
  • 1篇张清毅
  • 1篇唐士斌
  • 1篇马宜科
  • 1篇袁竞杰
  • 1篇张浩
  • 1篇郑亚松
  • 1篇王达
  • 1篇范灵俊

传媒

  • 1篇计算机应用与...
  • 1篇小型微型计算...
  • 1篇中国科学院大...

年份

  • 2篇2013
  • 1篇2012
3 条 记 录,以下是 1-3
排序方式:
细粒度并行归一化部分失真运动估计
2013年
移动视频编码应用对实时性要求越来越高,传统编码器中使用的串行运动估计算法难以满足实时编码要求.本文并行化移动编码中典型的运动估计算法———归一化部分失真搜索.采用比帧和宏块更小的候选块作为并行粒度,保持归一化部分失真快速排除非最佳候选块优势,同时充分利用多核计算资源.4核CPU平台上实验结果表明,相比串行算法,该并行算法在计算量增加不超过1.2%的前提下,实现了3.88至3.96的加速比.
袁竞杰张清毅马宜科宋风龙
关键词:视频编码并行计算
一种带有无效缓存路访问过滤机制的低功耗高速缓存
2012年
功耗是当今处理器设计领域的重要问题之一.随着多核处理器的普及,片上缓存占有了越来越多的芯片面积和功耗.提出一种带有无效缓存路访问过滤机制的低功耗高速缓存结构来降低CPU的动态功耗,具体为,通过无效缓存块的预先检查(Pre-Invalid Way Checking,PIWC)消除对无效缓存路的访问,及通过不匹配缓存路的预先检测(Pre-Mismatch Way Detecting,PMWD)消除对tag低位不匹配缓存路的访问.对实际程序的测试表明,65.2%-88.9%缓存路的无效访问可以通过以上方法被消除,约60.9%-85.6%由缓存访问带来的动态能耗从而被降低.同时,跟tag-data顺序访问方法相比,对于大多数程序,我们的方法可以获得5.1%-13.8%的节能效果提升.
范灵俊唐士斌张轮凯郑亚松张浩
关键词:动态功耗
一种针对片上众核结构共享末级缓存的改进的LFU替换算法被引量:5
2013年
为了得到更高的吞吐率和性能功耗比,众核处理器摒弃了复杂的乱序处理器核,而在芯片内集成了大量的轻量级顺序处理器核。为了更好地支持核间数据共享,并减少访问片外存储器带来的开销,众核处理器往往采用共享的末级缓存LLC(Last LevelCache)。因为需要对为数众多相对独立的访问请求作出响应,因此相对于传统多核处理器的末级片内缓存,众核处理器的末级片内缓存更容易产生抖动现象。传统的最久未使用LRU(Least Recent Used)高速缓存替换策略在这种情况下往往无能为力,而几种最新提出的高速缓存替换策略也见效甚微。基于传统的最不经常使用LFU(Least Frequent Used)替换算法,提出一种改进的高速缓存替换算法。相对于LFU替换算法,该算法获取信息的粒度更粗,并且可以掌握更加全局的信息,而这些优势使得该算法更适合作为众核处理器末级片内缓存的替换算法。实验结果表明,在一个64核的众核处理器上,该替换算法可以有效地缓解末级片内缓存的抖动现象,同时该算法实现需要的硬件开销很小。
张轮凯宋风龙王达
共1页<1>
聚类工具0