您的位置: 专家智库 > >

国家自然科学基金(60273046)

作品数:8 被引量:27H指数:4
相关作者:臧斌宇朱传琪朱嘉华张宏江王晔更多>>
相关机构:复旦大学江南计算技术研究所更多>>
发文基金:国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 8篇自动化与计算...
  • 1篇电子电信

主题

  • 2篇多媒体程序
  • 1篇代表元
  • 1篇调度
  • 1篇调度算法
  • 1篇多媒体
  • 1篇优化算法
  • 1篇周期解
  • 1篇自动向量化
  • 1篇位宽
  • 1篇向量
  • 1篇向量化
  • 1篇模变换
  • 1篇架构
  • 1篇SIMD
  • 1篇M1
  • 1篇并行度
  • 1篇并行化
  • 1篇并行化编译
  • 1篇差分方程
  • 1篇超长指令字

机构

  • 8篇复旦大学
  • 1篇江南计算技术...

作者

  • 8篇臧斌宇
  • 6篇朱传琪
  • 3篇张宏江
  • 3篇朱嘉华
  • 2篇王晔
  • 1篇姜伟华
  • 1篇王欣孃
  • 1篇王鹏
  • 1篇陈海波
  • 1篇鲁云萍
  • 1篇钱兴隆
  • 1篇倪奇智
  • 1篇马国凯
  • 1篇梅超
  • 1篇郭一

传媒

  • 4篇计算机学报
  • 2篇小型微型计算...
  • 1篇计算机工程与...
  • 1篇计算机应用与...

年份

  • 1篇2009
  • 1篇2008
  • 4篇2006
  • 1篇2005
  • 1篇2004
8 条 记 录,以下是 1-8
排序方式:
周期常量的检测与传播
2006年
周期常量是指循环中值呈周期性出现的递归标量.它的存在不仅带来循环内与跨循环数据相关,更导致一些不必要的控制相关.该文介绍了周期常量的概念及递归标量转化为差分方程的过程,并应用代数的相关知识提出并证明了周期常量存在的一个充分必要条件,由此给出了检测与传播周期常量的一个有效算法.该算法应用于ADPCM编/解码器,得到了平均超过10%的加速比.
陈海波朱嘉华张宏江臧斌宇
关键词:差分方程周期解
一种针对多媒体扩展指令集和实际多媒体程序的自动向量化方法被引量:4
2005年
自动向量化编译是利用处理器的多媒体扩展指令集提升多媒体程序性能的理想工具.但目前的研究不能有效加速实际程序.其主要原因是:普通算术操作的向量化不一定有性能提升;而多媒体典型操作因为其在源代码中表现形式多样而不能充分向量化.为了解决这一问题,文章对经典向量化算法[1]进行改进以灵活统一地向量化这两类操作.主要的改进是增加了两个步骤:统一操作的不同表现形式和识别有价值的向量化操作.改进后的算法可以充分利用指令集生成高效代码,从而对实际多媒体程序拥有良好效果.此外,该算法可扩展性也很强.
姜伟华梅超郭一朱嘉华臧斌宇朱传琪
多媒体程序中消除控制相关的技术研究被引量:1
2006年
随着多媒体应用的快速发展,最大程度地提升多媒体程序的性能逐渐变为计算机领域研究的热点。硬件平台和多媒体程序的特点是该领域研究需要关注的两个主要方面,当前的主流桌面处理器在提升主频的同时也增大了分支预测失误的开销,而多媒体应用程序中分支语句的大量使用进一步增大了分支预测失误的概率。我们在优化多媒体程序测试包BMW(BerkeleyMultimediaWorkload)过程中发现,通过消除程序中的控制相关,尽量减少程序中的分支指令可以显著地提升程序的性能。本文首先讨论了多媒体程序中消除控制相关的一些基本优化方法。针对当前主流处理器引入多媒体扩展指令集来优化程序的趋势,本文进一步总结了在SIMD架构下使用多媒体扩展指令集消除控制相关的方法。这两方面的优化方法应用到实际程序中,得到的平均性能提升分别为7%和26%。
张宏江臧斌宇朱传琪
保证Java精确异常的软件流水线技术被引量:2
2008年
Java对精确异常的支持严重限制了JIT编译器的动态优化的能力。目前已经有不少在精确异常存在下的优化技术,但它们都是针对代码块内部顺序指令的调度算法,依然没有在软件流水线这样循环级别做带精确异常的优化的算法。针对存在精确异常要求的Java程序,提出了一种软件流水线的算法,并以安腾作为底层平台对该算法进行了测试,实验结果显示该算法在保证Ja-va精确异常要求的情况下能够大幅度提高Java程序的性能。
倪奇智张为华臧斌宇朱传琪
关键词:JAVA
基于共享向量的二维SIMD调度算法被引量:3
2006年
针对目前二维SIMD结构编译技术研究的不足,结合二维SIMD结构中普遍采用的复用数据通路和寄存器少的限制和应用程序的特点,提出了一种解决数据向量复用的算法.该算法先使用数据向量的代表元计算各SIMD指令间数据向量的重用信息,再根据这些信息对SIMD指令进行调度.该算法可以有效缓解应用程序在二维SIMD结构执行时加载数据的压力,有效提高结构受限二维SIMD结构的并行性.实验数据显示,该算法对各种应用程序可获得平均2.97的加速比和平均3.86的SIMD指令级并行度.
张为华臧斌宇王晔钱兴隆朱传琪
关键词:代表元调度
利用U模变换增加并行粒度与改善数据访问局部性的方法被引量:4
2004年
提出了一种利用循环变换增加循环并行粒度 ,改善循环数据访问局部性的方法 .该方法利用了给定二重循环的相关向量集的某些性质 ,将外层循环变量不同而内层循环变量相等的若干次迭代合并 ,成为折叠后迭代空间的一个结点 ,并且保持内层循环的并行性不变 ,从而达到增加循环并行粒度的目的 .对于更普遍的情况 ,该文讨论了如何根据给定循环的循环向量集 ,确定一个U模变换对迭代空间进行变换 ,达到内层循环可并行和扩大循环粒度两个目的 .针对循环变换中数据访问局部性可能变差的问题 ,该文提出了对内层循环先合并 ,根据合并后的相关向量集变换迭代空间 ,以及折叠迭代空间的方法 .该文的方法是wavefront循环并行化方法的一种扩展 .
马国凯王欣孃王鹏臧斌宇朱传琪
关键词:并行化编译
基于位宽控制提高SIMD架构并行度的优化算法被引量:5
2009年
随着SIMD功能单元作为多媒体加速部件的广泛应用,如何有效利用这一构架优化应用程序成为编译优化研究的热点.目前典型的SIMD结构为同一操作对不同的数据位宽提供了不同的指令版本,随着操作数位宽的增加,对应的SIMD指令可同时完成的操作个数也随之降低.因此,如何有效识别操作数的有效位宽,对提高优化过程中SIMD指令内操作的并行度将产生至关重要的影响.文中针对SIMD优化面临的并行度问题,提出了一种优化算法,该算法在对操作数的有效位进行分析的基础上,进行溢出控制,从而减少操作数对宽位宽数据类型的依赖.实验数据表明,该算法可以有效提高多媒体程序优化的并行度,对多媒体程序获得较好的加速效果.
张为华朱嘉华张宏江臧斌宇
关键词:并行度
一种可重配置系统的模型被引量:10
2006年
U n ivers ity of C a liforn ia,Irv ine设计的M orphoSys M 1作为粗粒度可重配置系统中一个比较有代表性的系统,对于很多多媒体应用都获得了很好的加速比,但是它在设计上的一些不足造成运算功能单元没有被充分利用,从而对其整体性能的进一步提升有较大影响.针对M orphoSys M 1的不足,结合可重配置系统的研究现状和一些多媒体应用的特点,提出了一种新的可重配置系统的模型.实验数据显示,对于许多多媒体应用和加解密算法,改进后的模型相对于M orphoSys M 1至少可以获得16%的加速比.
张为华王晔鲁云萍臧斌宇朱传琪
关键词:M1多媒体超长指令字
共1页<1>
聚类工具0