刘骁
- 作品数:27 被引量:2H指数:1
- 供职机构:江南计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划国家科技重大专项更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 芯片访存通路的高效分段测试系统、方法
- 芯片访存通路的高效分段测试系统、方法,计算机体系结构与处理器微结构设计技术领域。系统包括存储控制器和存储器;存储控制器在其内部设有测试存储器、微操作控制器、IO寄存器,测试存储器用于模拟存储器的读、写延迟行为。方法包括步...
- 石嵩许勇刘骁周玉瀚吕晖谭弘兵张昆孙红辉
- 文献传递
- 一种基于并行循环压缩的余数运算电路及方法
- 本发明属于计算机整数乘法校验设计技术领域,特别涉及一种基于并行压缩循环的余数运算电路及方法。包括多个输入端,分别用于输入多个同位宽的二进制数;模加法器,用于输出求余结果;一层或多层进位保留加法器组件,设置在多个输入端和模...
- 高剑刚刘骁赵冠一张昆唐勇谢军朱巍王之辰
- 文献传递
- 一种支持数据在线重组的DMA访存方法及装置
- 本发明公开了一种支持数据在线重组的DMA访存方法及装置,涉及数据处理技术领域,包括:DMA引擎收到DMA传输指令时,判断DMA传输指令中是否有数据重组指示,若是则获取数据传输方向以及数据重组参数信息;DMA引擎将收到的D...
- 张清波施晶晶刘骁唐勇杨萱郝子宇
- 共享指令缓存XOR散列索引的研究与设计被引量:2
- 2019年
- SPMD(Single Program Multiple Data)是高性能领域的主要工作模式之一,该模式下邻近核心执行相同的程序块,但根据处理数据或控制流的差异,临近核心的指令流并不完全相同.L1 ICache(Instruction Cache)共享技术通过将邻近核心的L1 ICache共享,能有效利用众核处理器SPMD工作模式的特点,同时能缓解片上资源紧张的问题.但共享结构会带来访问冲突,对性能有不利影响.本文基于排队网络对共享ICache的访问冲突进行了理论分析,该理论分析依据核心对共享ICache体的访问特性进行建模,避免了直接抽象物理节点导致的模型访存特性模糊问题.根据理论推导的指令缓存性能损失原因,本文设计了面向共享L1 ICache的低访问冲突XOR散列函数.函数的设计综合考虑搜索了代价和工程实现复杂性,在保证散列线性空间随机散列能力的前提下,对附加延迟、功耗开销进行控制.该散列函数基于异或操作,通过调整ICache排队网络模型的节点转换概率,降低了共享L1 ICache的访问冲突.实验结果表明,在指令缓存总容量为32 KB的四核心簇上,使用XOR散列的共享L1 ICache结构较私有L1 ICache结构性能平均优化11%,较使用低位交错策略的共享L1 ICache结构性能平均优化8%,较使用面向跨步访存散列策略的共享L1 ICache结构性能平均优化3.2%.
- 刘骁唐勇郑方丁亚军
- 一种高能效的结构不对称指令缓存
- 2017年
- 在现代微处理器中,指令缓存的Tag读取、比较消耗了指令缓存较大比例的能耗。提出一种基于推断的低能耗指令缓存:不对称指令缓存。根据跳转指令比例低的特点,在该结构中区别处理跳转指令和顺序指令,使用和数据不完全对应的简化标记管理位。该结构采用了命中推断和变长指令取指两种创新技术,其中基于命中推断技术解决了指令缓存命中时Tag比较过多的问题;使用变长指令取指技术提高了顺序指令块的命中率。实验结果表明,对于选取的SPEC2006测试程序,不对称指令缓存结构较常规L1指令Cache取指能耗下降了40%~60%,比无标记指令缓存结构TH IC能耗降低了9%;取指ED2P方面,较常规L1指令Cache优化约50%,比TH IC结构优化约17%。
- 刘骁高红光陈芳园丁亚军
- 关键词:能耗
- 一种适用于多核心处理器的TLB配置方式
- 本发明涉及计算机数据计算领域,具体涉及处理器对虚拟内存读取过程中的优化方式。本发明是通过以下技术方案得以实现的:一种适用于多核心处理器的TLB配置方式,包含如下步骤:S01、TLB布置步骤;将所述TLB安装在访存通路的公...
- 王谛唐勇张清波陈庆强刘骁施晶晶
- 一种浮点数尾数域余数运算电路及方法
- 本发明为一种浮点数尾数域余数运算电路及方法,包括乘法余数码运算电路和取反结果余数运算电路,乘法余数码运算电路包括两个第一输入组件、一个模乘法器及一层或多层第一模加器组件。取反结果余数运算电路包括一个第二输入组件、一个模减...
- 刘骁杨瑒王谛吴铁彬周建毅赵冠一周玉瀚
- 基于窗口的错误访存请求重传系统及方法
- 本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种基于窗口的错误访存请求重传系统及方法。基于窗口的错误访存请求重传系统,包括重传缓冲,用于缓存正在飞行的请求,如果请求完成则将其释放,如果请求出错则根据出错请求的错...
- 丁亚军石嵩吕晖刘骁王迪高红光张清波王之辰
- 文献传递
- 一种面向多请求来源的DDR4性能平衡调度结构及方法
- 本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种面向多请求来源的DDR4性能平衡调度结构及方法。一种面向多请求来源的DDR4性能平衡调度结构,包括多个访存请求调度缓冲,用于提高对应访存请求来源的访存带宽;多来源...
- 吕晖石嵩刘骁吴铁彬赵冠一王迪王吉军
- 文献传递
- 一种访存系统
- 一种访存系统,计算机体系结构与处理器微结构设计技术领域。系统包括存储控制器和存储器;存储器为由两组存储颗粒构成的128位存储器,每组存储颗粒为64位;存储控制器包括用户接口、第一控制通路CCH0、第二控制通路CCH1、第...
- 高剑刚石嵩吕晖宁永波严忻恺吴铁彬刘骁
- 文献传递