您的位置: 专家智库 > >

北京市自然科学基金(4072024)

作品数:19 被引量:63H指数:4
相关作者:沈海华王剑胡伟武章隆兵卫文丽更多>>
相关机构:中国科学院中国科学院研究生院中国科学技术大学更多>>
发文基金:北京市自然科学基金国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 19篇期刊文章
  • 1篇会议论文

领域

  • 18篇自动化与计算...
  • 2篇电子电信

主题

  • 6篇龙芯
  • 5篇处理器
  • 3篇电路
  • 3篇微处理器
  • 3篇内存
  • 2篇点乘
  • 2篇形式化
  • 2篇形式化验证
  • 2篇性能分析
  • 2篇运算电路
  • 2篇容错
  • 2篇瞬态故障
  • 2篇自动化
  • 2篇芯片组
  • 2篇PCI
  • 2篇BDD
  • 1篇堆栈
  • 1篇多播
  • 1篇多进程
  • 1篇多线程

机构

  • 16篇中国科学院
  • 7篇中国科学院研...
  • 2篇中国科学技术...

作者

  • 6篇沈海华
  • 3篇章隆兵
  • 3篇胡伟武
  • 3篇王剑
  • 2篇郭崎
  • 2篇张瑾
  • 2篇蔡飞
  • 2篇张仕健
  • 2篇陈云霁
  • 2篇卫文丽
  • 2篇唐志敏
  • 2篇王朋宇
  • 1篇刘奇
  • 1篇蔡嵩松
  • 1篇马可
  • 1篇刘金刚
  • 1篇郭琦
  • 1篇胡明昌
  • 1篇张珩
  • 1篇许先超

传媒

  • 4篇计算机研究与...
  • 2篇Journa...
  • 2篇电子学报
  • 2篇计算机学报
  • 2篇计算机工程与...
  • 2篇计算机工程
  • 2篇高技术通讯
  • 2篇Journa...
  • 1篇计算机辅助设...
  • 1篇第六届中国测...

年份

  • 1篇2011
  • 4篇2010
  • 7篇2009
  • 5篇2008
  • 3篇2007
19 条 记 录,以下是 1-10
排序方式:
一种快速的滑动标记缩并垃圾收集算法被引量:1
2008年
Java语言完全面向对象,因此对象局部性是衡量Java虚拟机性能的重要指标.在Java虚拟机中,由垃圾收集算法负责检测并且回收不再使用的对象,它直接影响着Java程序的性能.保持对象分配序能够提供最佳的局部性.滑动标记缩并算法正是基于这一原则,但是传统上的设计使得算法的效率很低.本文提出一种快速的滑动标记缩并算法,它通过位图、活块池和块内偏移表来简化算法,大大的降低了开销.实验结果表明,快速的滑动标记缩并算法使得标准工业测试程序SPECJVM98的性能在Pentium4上有不同程度的提高,最高达到8.9%;同时程序的局部性也优于线性标记缩并算法,与深度遍历序相比,DTLB(Data Translation Lookaside Buffer)与2级Cache失效率改善最多分别为11%和13.6%.
邹琼章隆兵
关键词:垃圾收集位图
一种向分支指令后插入冗余指令的容错微结构被引量:3
2007年
随着深亚微米工艺的广泛应用,瞬态故障已成为芯片失效的主要原因.文中提出了一种向分支指令后插入冗余指令的容错微结构,利用分支误预测浪费的处理带宽,降低了冗余执行导致的性能损失.实验结果表明,该技术的性能损失在6%~31%之间,平均为21%,明显低于MBI技术而和DIE技术的性能损失相当.该技术能够检测流水线上各阶段发生的瞬态故障并能恢复处理器状态,故障检测延时短,需要的硬件开销也较小,非常适合提高带有简单预测机制的嵌入式微处理器的容错能力.
张仕健胡伟武
关键词:瞬态故障时间冗余容错嵌入式微处理器
基于流水思想的虚拟网络广多播优化策略
2011年
对TCP/IP协议中的链路层广播、多播应用以及多处理器环境中基于共享内存的虚拟网络设备的实现进行分析。对比以太网和基于共享内存的虚拟网络条件下实现广播、组播时物理层及数据链路层的不同。分析VxWorks操作系统中基于共享内存的虚拟网络设备驱动程序对广播、组播的实现策略,并根据多龙芯2E处理器并行信号处理板的结构特点提出基于流水思想的优化策略。优化后的网络具有更好的实时性、节点负载均衡性和更高的传输效率。
闫超王光旭刘明
关键词:共享内存虚拟网络VXWORKS操作系统
龙芯3A处理器封装的散热设计
2009年
随着处理器的性能越来越高,处理器的功耗和温度也随之攀升,这就对处理器的封装提出了更高的要求。本文针对龙芯3A高性能处理器对封装的散热问题,根据成熟的工艺水平选择了FC-BGA封装形式,并对散热和外加散热措施的方法进行了分析和研究。实验模拟结果表明,FC-BGA的封装形式完全能满足龙芯3A处理器对封装散热的要求。
张瑾王剑
关键词:龙芯3A封装散热
龙芯2号原型系统北桥的设计与实现被引量:4
2010年
针对龙芯2号原型系统中主要I/O数据通路上数据流的特点,设计并实现了一款适用于龙芯2号原型系统的北桥。在此北桥的设计中提出并实现了一种用于外部设备互连(PCI)主桥(PCI host bridge,PHB)的数据传输优化方法,这种方法通过自适应的写合并、PCI写数据及时收集重打包和采用固定开销的分阶段PCI读数据预取策略,提高了PCI主桥中数据传输的效率。实验结果表明,所设计的北桥可以充分的利用PCI总线带宽,并且在处理PCI总线上的直接内存访问(DMA)读数据流和处理器更新显卡显存的PCI写数据流时相对同类系统而言具有明显的性能优势。
蔡飞沈海华高翔
关键词:龙芯芯片组
使用支持向量机的微处理器验证向量优化方法被引量:1
2010年
为了解决微处理器仿真验证中随机验证向量质量不高的问题,提出了一种基于支持向量机(SVM)的验证向量优化方法。该方法将已仿真运行的验证向量及其覆盖率信息作为支持向量机的样本进行有监督学习,得到验证向量关于功能覆盖点的分类器。利用训练后的分类器对于新产生的验证向量进行预测,并丢弃预测中不能提高覆盖率的冗余验证向量。实验数据表明该方法能准确地过滤冗余验证向量,提高仿真运行的验证向量的质量。和完全随机的验证向量生成方法相比,该方法达到相同的功能覆盖率仅需要前者1/3的验证向量。
王朋宇郭崎沈海华陈云霁张珩
关键词:微处理器验证仿真验证
基于遗传算法的全芯片级覆盖率驱动随机验证技术被引量:6
2009年
随机测试生成技术是当今大规模集成电路仿真验证流程中的重要支撑技术.覆盖率驱动的随机测试生成方法是目前该领域研究的热点.遗传算法具有部分优化问题的黑盒特性,不需要了解问题的太多先验知识,适合处理黑盒优化问题.因此,将遗传算法应用在覆盖率反馈驱动随机测试生成时,不需要复杂的领域先验知识,节约了大量的专家时间,提高了验证的自动化程度.分析了各种基于遗传算法的覆盖率驱动的随机测试生成方法,并在此基础上设计和实现了基于遗传算法的全芯片级覆盖率驱动随机验证平台.该平台被实际应用在龙芯处理器的验证中,实验结果表明,平台有效提高了验证效率.
沈海华王朋宇卫文丽郭崎
关键词:大规模集成电路遗传算法
基于龙芯处理器的二进制翻译器优化被引量:14
2009年
二进制翻译是实现系统迁移的主要方法,但基于通用平台的仅靠软件实现的二进制翻译性能不高。该文以龙芯2F处理器为实现平台,提出一种QEMU二进制翻译器并进行优化,其中包括编译环境的优化以及二进制翻译器本身的优化2个方面,对后者的优化主要涉及寄存器直接映射和多媒体指令的改进。实验结果表明,通过寄存器映射优化后,系统能够获得1.45的加速比,通过多媒体优化后,多媒体程序的执行能达到本地机器执行的80%的性能。
蔡嵩松刘奇王剑刘金刚
关键词:寄存器堆栈
Chip Multithreaded Consistency Model
2008年
多线程的技术是高效处理器的发展中的趋势。记忆一致性模型对多线程处理器的正确性,表演和复杂性必要。薄片多线程一致性模型适应多线程处理器在这篇论文被建议。在存储器事件由芯片命令多线程的一致性被介绍并且形式化上强加的限制。与胡维武造的批评周期的想法,我们证明建议薄片多线程一致性模型满足顺序一致性模型的正确执行的标准。芯片多线程的一致性模型提供与顺序一致性模型相比完成高效的一个方法并且保证在多线程处理器的执行结果与在单处理机的执行结果一样的软件的相容性。在 Godson-2 SMT 处理器的多线程的一致性模型也是的薄片的实现策略求婚了。Godson-2 SMT 处理器支持基于每个线程的顺序的存储器存取队列由异常计划正确地削多线程的一致性模型。电子增补材料这篇文章(doi:10.1007/s11390-008-9132-0 ) 的联机版本包含增补材料,它对授权用户可得到。
李祖松郇丹丹胡伟武唐志敏
关键词:计算机计算方法内存多进程
Testing content addressable memories with physical fault models
2009年
Content addressable memory (CAM) is widely used and its tests mostly use functional fault models. However, functional fault models cannot describe some physical faults exactly. This paper introduces physical fault models for write-only CAM. Two test algorithms which can cover 100% targeted physical faults are also proposed. The algorithm for a CAM module with N-bit match output signal needs only 2N+2L+4 comparison operations and 5N writing operations, where N is the number of words and L is the word length. The algorithm for a HIT-signal-only CAM module uses 2N+2L+5 comparison operations and 8N writing operations. Compared to previous work, the proposed algorithms can test more physical faults with a few more operations. An experiment on a test chip shows the effectiveness and efficiency of the proposed physical fault models and algorithms.
马麟杨旭钟石强陈云霁
关键词:内容可寻址存储器物理故障分子物理
共2页<12>
聚类工具0