您的位置: 专家智库 > >

国家自然科学基金(60905007)

作品数:5 被引量:36H指数:2
相关作者:梅魁志张骏赵季中张斌田泽更多>>
相关机构:西安交通大学中国航空工业集团公司西安航空计算技术研究所更多>>
发文基金:国家自然科学基金国家科技重大专项国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 4篇处理器
  • 2篇置信度
  • 2篇置信度评估
  • 2篇CACHE
  • 1篇单芯片多处理...
  • 1篇多处理器
  • 1篇多核
  • 1篇多核处理
  • 1篇多核处理器
  • 1篇多核结构
  • 1篇选择性
  • 1篇一致性
  • 1篇硬件
  • 1篇硬件设计
  • 1篇指令预取
  • 1篇片上多核处理...
  • 1篇中图法
  • 1篇自适
  • 1篇自适应
  • 1篇微处理器

机构

  • 5篇西安交通大学
  • 1篇中国航空工业...

作者

  • 4篇梅魁志
  • 3篇张骏
  • 2篇赵季中
  • 2篇张斌
  • 1篇李国辉
  • 1篇田泽
  • 1篇郭青

传媒

  • 2篇西安交通大学...
  • 2篇小型微型计算...
  • 1篇计算机学报

年份

  • 1篇2014
  • 1篇2013
  • 1篇2012
  • 2篇2010
5 条 记 录,以下是 1-5
排序方式:
基于节点预测的直接Cache一致性协议被引量:33
2014年
处理器性能的提升依赖于对存储系统性能的挖掘.随着片上集成内核数量的不断增大和特征尺寸的持续缩小,延迟、存储可扩展的Cache一致性协议已经成为提升访存效率的关键性因素.文中提出一种基于节点预测的直接Cache一致性协议-NPP协议,研究一致性交互延迟隐藏和目录存储开销减少技术.针对读、写缺失中存在的间接性问题和现有解决方案破坏已有数据局部性、无法获得最近数据副本等问题,分别提出节点挂起技术和直接写缺失处理技术,有效隐藏了目录访问延迟.为了实现准确的节点预测,作者还提出基于“签名”回收的历史信息更新算法,避免了冗余更新和不完整更新.使用SPLASH-2测试程序集,在基于2DMESHNoC互联的64核CMP下,相对于全映射目录协议,NPP协议的平均执行时间降幅为21.78%~31.11%;平均读缺失延迟降低14.22%~18.9%;平均写缺失延迟降低17.89%~21.13%.而获得上述性能提升的代价是网络流量平均增加6.62%~7.28%.
张骏田泽梅魁志赵季中
一种面向写穿透Cache的写合并设计及验证被引量:2
2010年
为了利用片上缓冲技术来提高处理器应用性能,提出一种面向写穿透Cache的写合并设计方法.使用同步动态随机存储器(SDRAM)的单个写方式和片上写缓冲器,对SDRAM一行内的局部数据采用写合并策略,由此提高了外部存储的访问效率,同时给出了连续和单个Cache读写的缓存与内存的数据一致性策略.在寄存器传输语言(RTL)仿真环境下使用mp3解码对Leon2处理器进行数据测试,结果表明:在缓冲区优化为3行8列的参数下,SDRAM每次行开启平均进行7.8个字的写入操作,外存的读写效率由12%提高到19%;在TSMC0.18μm工艺下,综合后面积为0.263mm2,流片后工作主频为100MHz.
梅魁志李国辉张斌
关键词:处理器
面向微处理器猜测执行过程中预载入数据的Cache污染控制方法
2012年
"存储墙"问题已经成为处理器性能提升的主要障碍,而处理器内核猜测执行预测路径上访存指令时预载入的存储器数据所导致Cache污染会严重影响处理器性能.本文提出一种针对猜测执行过程中预载入数据的Cache污染控制方法CSDA.首先,利用置信度评估技术从所有预测路径中分离出错误概率较大的路径.然后,根据低置信度污染型访存指令识别历史表将低置信度预测路径上的访存指令划分为预取型和污染型,为污染型的访存指令建立低优先级Load/Store队列,并采用污染数据Cache存储污染数据.仿真结果表明,在双核模式下,CSDA策略相对于baseline结构来说,L1 D-Cache缺失率降低幅度从9%-23%,平均降低了17%;L2 Cache缺失率的下降范围从1.02%-14.39%,平均为5.67%;IPC的提升幅度从0.19%-5.59%,平均为2.21%.
张骏
关键词:微处理器置信度评估
面向多核结构的自适应选择性指令主动推送技术被引量:1
2013年
正确有效的指令预取策略是避免指令缺失的关键技术,程序流程改变时指令预取方向正确率不高、指令预取准确度和存储器带宽有效利用率较低是导致指令缺失的主要因素.本文提出基于置信度评估的自适应选择性指令主动推送技术ASIAP,一方面减少无效指令预取的数量,进行精确指令预取,在避免Cache污染的同时提升指令预取的有效性;另一方面采用指令主动推送部件自适应选择性地完成部分非顺序指令预取请求,减少了取入错误路径上无用指令的可能.通过与Next_Line、Target_Line、Wrong_Path、BTA、Markov和CFGP等策略的对比,在2-16内核配置下,ASIAP策略相对于其它策略准确性平均提升3.7%-28.71%;L1 I-cache缺失率平均下降3.3%-14.39%.
张骏梅魁志赵季中
关键词:片上多核处理器置信度评估自适应指令预取
仿生物视觉的非均匀采样方法及其硬件设计
2010年
利用生物的选择注意机制可减少计算量的优势,提出了仿生物视觉的非均匀采样方法并实现了硬件设计.利用基于高斯函数的模型模拟了生物视觉的选择性响应特性,由此得到采样层优先和采样密度优先的2种非均匀采样表达式.在视觉处理芯片中,根据人眼特性并利用采样密度优先的方法,将图像分为4层进行非均匀采样和数据传送.实验表明:较之已有的非均匀采样方法,所提方法更具生物视觉特性和物理可实现性,并具有较高的压缩率;当注视点为图像中心时,数据压缩率达到了1/28;利用任意选取注视点得到的非均匀采样数据恢复的图像效果符合人眼视觉特性.
张斌梅魁志郭青
关键词:非均匀采样
共1页<1>
聚类工具0