公共文化服务平台

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

细粒度并行归一化部分失真运动估计: 2013年; 移动视频编码应用对实时性要求越来越高,传统编码器中使用的串行运动估计算法难以满足实时编码要求.本文并行化移动编码中典型的运动估计算法———归一化部分失真搜索.采用比帧和宏块更小的候选块作为并行粒度,保持归一化部分失真快速排除非最佳候选块优势,同时充分利用多核计算资源.4核CPU平台上实验结果表明,相比串行算法,该并行算法在计算量增加不超过1.2%的前提下,实现了3.88至3.96的加速比.; 袁竞杰张清毅马宜科宋风龙; 关键词：视频编码并行计算

一种带有无效缓存路访问过滤机制的低功耗高速缓存: 2012年; 功耗是当今处理器设计领域的重要问题之一.随着多核处理器的普及,片上缓存占有了越来越多的芯片面积和功耗.提出一种带有无效缓存路访问过滤机制的低功耗高速缓存结构来降低CPU的动态功耗,具体为,通过无效缓存块的预先检查(Pre-Invalid Way Checking,PIWC)消除对无效缓存路的访问,及通过不匹配缓存路的预先检测(Pre-Mismatch Way Detecting,PMWD)消除对tag低位不匹配缓存路的访问.对实际程序的测试表明,65.2%-88.9%缓存路的无效访问可以通过以上方法被消除,约60.9%-85.6%由缓存访问带来的动态能耗从而被降低.同时,跟tag-data顺序访问方法相比,对于大多数程序,我们的方法可以获得5.1%-13.8%的节能效果提升.; 范灵俊唐士斌张轮凯郑亚松张浩; 关键词：动态功耗

一种针对片上众核结构共享末级缓存的改进的LFU替换算法被引量：5: 2013年; 为了得到更高的吞吐率和性能功耗比,众核处理器摒弃了复杂的乱序处理器核,而在芯片内集成了大量的轻量级顺序处理器核。为了更好地支持核间数据共享,并减少访问片外存储器带来的开销,众核处理器往往采用共享的末级缓存LLC(Last LevelCache)。因为需要对为数众多相对独立的访问请求作出响应,因此相对于传统多核处理器的末级片内缓存,众核处理器的末级片内缓存更容易产生抖动现象。传统的最久未使用LRU(Least Recent Used)高速缓存替换策略在这种情况下往往无能为力,而几种最新提出的高速缓存替换策略也见效甚微。基于传统的最不经常使用LFU(Least Frequent Used)替换算法,提出一种改进的高速缓存替换算法。相对于LFU替换算法,该算法获取信息的粒度更粗,并且可以掌握更加全局的信息,而这些优势使得该算法更适合作为众核处理器末级片内缓存的替换算法。实验结果表明,在一个64核的众核处理器上,该替换算法可以有效地缓解末级片内缓存的抖动现象,同时该算法实现需要的硬件开销很小。; 张轮凯宋风龙王达

全选清除导出

共1页<1>

国家自然科学基金(61100013)