您的位置: 专家智库 > >

刘骁

作品数:27 被引量:2H指数:1
供职机构:江南计算技术研究所更多>>
发文基金:国家高技术研究发展计划国家科技重大专项更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 23篇专利
  • 3篇期刊文章
  • 1篇会议论文

领域

  • 19篇自动化与计算...
  • 1篇文化科学

主题

  • 11篇计算机
  • 9篇体系结构
  • 9篇计算机体系
  • 9篇计算机体系结...
  • 7篇处理器
  • 7篇存储器
  • 5篇请求
  • 4篇带宽
  • 4篇电路
  • 4篇余数
  • 4篇运算电路
  • 4篇乘法
  • 3篇调度
  • 3篇请求调度
  • 3篇主存
  • 3篇微结构
  • 3篇缓存
  • 3篇高带宽
  • 2篇点阵
  • 2篇读写

机构

  • 27篇江南计算技术...

作者

  • 27篇刘骁
  • 10篇吕晖
  • 10篇石嵩
  • 6篇唐勇
  • 6篇张昆
  • 5篇张清波
  • 5篇高红光
  • 4篇谢军
  • 4篇高剑刚
  • 4篇陈芳园
  • 3篇丁亚军
  • 3篇王谛
  • 3篇郑方
  • 3篇过锋
  • 3篇宁永波
  • 2篇胡晋
  • 2篇李川
  • 2篇李宏亮
  • 2篇许勇
  • 2篇郝子宇

传媒

  • 2篇计算机工程与...
  • 1篇计算机学报
  • 1篇2014全国...

年份

  • 1篇2024
  • 1篇2023
  • 9篇2022
  • 5篇2021
  • 7篇2020
  • 1篇2019
  • 1篇2018
  • 1篇2017
  • 1篇2014
27 条 记 录,以下是 1-10
排序方式:
芯片访存通路的高效分段测试系统、方法
芯片访存通路的高效分段测试系统、方法,计算机体系结构与处理器微结构设计技术领域。系统包括存储控制器和存储器;存储控制器在其内部设有测试存储器、微操作控制器、IO寄存器,测试存储器用于模拟存储器的读、写延迟行为。方法包括步...
石嵩许勇刘骁周玉瀚吕晖谭弘兵张昆孙红辉
文献传递
一种基于并行循环压缩的余数运算电路及方法
本发明属于计算机整数乘法校验设计技术领域,特别涉及一种基于并行压缩循环的余数运算电路及方法。包括多个输入端,分别用于输入多个同位宽的二进制数;模加法器,用于输出求余结果;一层或多层进位保留加法器组件,设置在多个输入端和模...
高剑刚刘骁赵冠一张昆唐勇谢军朱巍王之辰
文献传递
一种支持数据在线重组的DMA访存方法及装置
本发明公开了一种支持数据在线重组的DMA访存方法及装置,涉及数据处理技术领域,包括:DMA引擎收到DMA传输指令时,判断DMA传输指令中是否有数据重组指示,若是则获取数据传输方向以及数据重组参数信息;DMA引擎将收到的D...
张清波施晶晶刘骁唐勇杨萱郝子宇
共享指令缓存XOR散列索引的研究与设计被引量:2
2019年
SPMD(Single Program Multiple Data)是高性能领域的主要工作模式之一,该模式下邻近核心执行相同的程序块,但根据处理数据或控制流的差异,临近核心的指令流并不完全相同.L1 ICache(Instruction Cache)共享技术通过将邻近核心的L1 ICache共享,能有效利用众核处理器SPMD工作模式的特点,同时能缓解片上资源紧张的问题.但共享结构会带来访问冲突,对性能有不利影响.本文基于排队网络对共享ICache的访问冲突进行了理论分析,该理论分析依据核心对共享ICache体的访问特性进行建模,避免了直接抽象物理节点导致的模型访存特性模糊问题.根据理论推导的指令缓存性能损失原因,本文设计了面向共享L1 ICache的低访问冲突XOR散列函数.函数的设计综合考虑搜索了代价和工程实现复杂性,在保证散列线性空间随机散列能力的前提下,对附加延迟、功耗开销进行控制.该散列函数基于异或操作,通过调整ICache排队网络模型的节点转换概率,降低了共享L1 ICache的访问冲突.实验结果表明,在指令缓存总容量为32 KB的四核心簇上,使用XOR散列的共享L1 ICache结构较私有L1 ICache结构性能平均优化11%,较使用低位交错策略的共享L1 ICache结构性能平均优化8%,较使用面向跨步访存散列策略的共享L1 ICache结构性能平均优化3.2%.
刘骁唐勇郑方丁亚军
一种高能效的结构不对称指令缓存
2017年
在现代微处理器中,指令缓存的Tag读取、比较消耗了指令缓存较大比例的能耗。提出一种基于推断的低能耗指令缓存:不对称指令缓存。根据跳转指令比例低的特点,在该结构中区别处理跳转指令和顺序指令,使用和数据不完全对应的简化标记管理位。该结构采用了命中推断和变长指令取指两种创新技术,其中基于命中推断技术解决了指令缓存命中时Tag比较过多的问题;使用变长指令取指技术提高了顺序指令块的命中率。实验结果表明,对于选取的SPEC2006测试程序,不对称指令缓存结构较常规L1指令Cache取指能耗下降了40%~60%,比无标记指令缓存结构TH IC能耗降低了9%;取指ED2P方面,较常规L1指令Cache优化约50%,比TH IC结构优化约17%。
刘骁高红光陈芳园丁亚军
关键词:能耗
一种适用于多核心处理器的TLB配置方式
本发明涉及计算机数据计算领域,具体涉及处理器对虚拟内存读取过程中的优化方式。本发明是通过以下技术方案得以实现的:一种适用于多核心处理器的TLB配置方式,包含如下步骤:S01、TLB布置步骤;将所述TLB安装在访存通路的公...
王谛唐勇张清波陈庆强刘骁施晶晶
一种浮点数尾数域余数运算电路及方法
本发明为一种浮点数尾数域余数运算电路及方法,包括乘法余数码运算电路和取反结果余数运算电路,乘法余数码运算电路包括两个第一输入组件、一个模乘法器及一层或多层第一模加器组件。取反结果余数运算电路包括一个第二输入组件、一个模减...
刘骁杨瑒王谛吴铁彬周建毅赵冠一周玉瀚
基于窗口的错误访存请求重传系统及方法
本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种基于窗口的错误访存请求重传系统及方法。基于窗口的错误访存请求重传系统,包括重传缓冲,用于缓存正在飞行的请求,如果请求完成则将其释放,如果请求出错则根据出错请求的错...
丁亚军石嵩吕晖刘骁王迪高红光张清波王之辰
文献传递
一种面向多请求来源的DDR4性能平衡调度结构及方法
本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种面向多请求来源的DDR4性能平衡调度结构及方法。一种面向多请求来源的DDR4性能平衡调度结构,包括多个访存请求调度缓冲,用于提高对应访存请求来源的访存带宽;多来源...
吕晖石嵩刘骁吴铁彬赵冠一王迪王吉军
文献传递
一种访存系统
一种访存系统,计算机体系结构与处理器微结构设计技术领域。系统包括存储控制器和存储器;存储器为由两组存储颗粒构成的128位存储器,每组存储颗粒为64位;存储控制器包括用户接口、第一控制通路CCH0、第二控制通路CCH1、第...
高剑刚石嵩吕晖宁永波严忻恺吴铁彬刘骁
文献传递
共3页<123>
聚类工具0