王旭昊 作品数:12 被引量:23 H指数:3 供职机构: 西安交通大学 更多>> 发文基金: 国家高技术研究发展计划 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
基于CMP的推测多线程机制下的独立栈函数调用方法 本发明公开了基于CMP的推测多线程机制下的独立栈函数调用方法,克服共享栈函数调用方法存在的栈加锁问题,以保证推测多线程下程序调用函数正确高效的进行。处理器在初始化的时候,在共享的内存空间中为每个处理器单元划分出一段私有的... 赵银亮 韦远科 宋少龙 王旭昊编译器支持下的推测多线程内存数据同步执行方法及装置 本发明公开了一种编译器支持下的推测多线程内存数据同步执行方法及其装置,能在程序运行时对选定的读写内存指令进行同步,降低读后写数据依赖违规发生的次数,提高多线程同步操作的整体加速比。在获取候选读/写指令对之后,在读指令前添... 赵银亮 王旭昊 韦远科 宋少龙面向片上多核处理器的推测多线程机制下的独立栈模型 被引量:1 2010年 在推测多线程并行执行时,各线程中借助共享栈来实现函数调用的过程存在互斥访问问题,为此提出了一种采用片上多处理器(CMP)的推测多线程机制下的独立栈函数调用模型,核栈采用一对一方式,栈之间的有机配合支持推测多线程中的函数调用.通过在模拟器端添加两条指令实现栈空间的管理,从而消除了共享栈模型中的加锁问题.为了保证程序正常运行,编译器对生成的代码作相应的调整,模拟器方面则增添了get和update两条指令,以便管理相应的栈空间.因为独立栈函数调用方法消除了共享栈模型中的栈加锁问题,使得成功线程发起的数目有不同程度的提高,从而提高了程序的并行加速比.Olden基准程序的测试表明,独立栈模型相对于共享栈模型使程序的平均并行加速比提高了3.85%.但是,由于影响程序推测并行加速比的因素复杂,某些测试程序也出现了独立栈的加速比低于共享栈的情况. 韦远科 赵银亮 宋少龙 王旭昊 阴培培 李挺关键词:推测多线程 代码生成 存储管理 基于Cell多核处理器的层次化运行时支持技术 被引量:2 2010年 基于Cell处理器的异构多核架构及软件显式管理的多级存储层次,使其面临编程困难和性能难以有效发挥等问题.现有基于Cell/B.E.的编程模型多侧重于支持类似于流处理的"批量访存"(bulk data transfer)应用,传统非规则访存应用性能较低.通过扩展Cell/B.E.访存库增强协处理单元的自主作用,以协处理单元为中心建立Cell计算平台上的MPI和弱一致性Pthread分层并行编程运行时支持.分层的运行时支持结构及扩展后的Cell/B.E.访存库使模型具有更好的效率和可扩展性,并且提高了非规则应用的性能;模型中的MPI方便了大量传统并行应用向新架构的移植及开发,而弱一致性Pthread则为MPI提供高效的任务运行时管理支持及为系统级用户提供对架构全面控制的编程接口.实验结果表明,提出的运行时支持技术不仅可适应不同应用的要求,同时借助访存库中的剖分优化机制可有效地挖掘Cell/B.E.架构性能. 董小社 冯国富 王旭昊 冯景华 胡雷钧关键词:异构多核 分层结构 面向Cell宽带引擎架构的异构多核访存技术 被引量:12 2009年 针对Cell宽带引擎架构(CBEA)多核高性能处理器要求软件显式地对分层存储结构进行管理,带来架构的可编程性及性能等问题,提出了一种基于CBEA的异构多核访存技术.将CBEA访存分为批量访存和按需访存;通过合理部署数据缓冲区来减小批量访存计算中的片内访存开销,利用支持粗粒度访问的软件管理cache及数据预取来降低按需访存的片外访存开销;以访存接口库的方式来改善软件的可编程性.实验结果表明,所提技术的访存接口库在批量访存方式下的性能比ALF和CellSs提高了30%~50%,按需访存中软件管理cache性能比CBE软件开发工具包提高了20%~30%,4路数据预取访存比单路缓存的性能提高约50%. 冯国富 董小社 丁彦飞 王旭昊关键词:异构多核 面向CBEA 异构多核的运行时支持库技术研究 本研究分析了CBEA架构,通过对CBESDK进行封装和扩展,为Cell架构提供支持Pthread和MPI两层并行编程运行时支持库环境。通过扩展、优化SPE访存库为应用提供更高的运行效率和访存组合方案,便于灵活、高效解决非... 董小社 冯国富 王旭昊 胡冰 伍卫国关键词:异构多核 并行编程 芯片设计 文献传递 支持推测多线程的扩展多核模拟器Prophet+ 被引量:3 2010年 推测多线程技术是软硬件协同开发非规则应用程序的线程级并行性的有效方法.通过体系结构对推测并行执行模式的支持,编译器产生推测多线程目标代码实现自动并行化加速.文中针对硬件平台如何有效支持程序运行过程的分析及测试,提出了一种支持推测并行执行模式的超标量流水线结构和一种基于独立栈的运行时内存空间管理方法.通过对Prophet模拟器扩展实现,并经Olden基准程序测试表明,扩展后的Prophet+在保持Prophet模拟器性能的前提下,提高了模拟器的精度和灵活性. 宋少龙 赵银亮 冯博琴 韦远科 王旭昊 赵恒星关键词:线程级并行 推测多线程 片上多处理器 流水线 模拟器 面向Cell架构的异构多核访存技术研究与实现 王旭昊关键词:异构 多核 编译支持下的推测多线程内存数据同步方法研究 王旭昊关键词:推测多线程 数据流分析 编译器支持下的推测多线程内存数据同步执行方法及装置 本发明公开了一种编译器支持下的推测多线程内存数据同步执行方法及其装置,能在程序运行时对选定的读写内存指令进行同步,降低读后写数据依赖违规发生的次数,提高多线程同步操作的整体加速比。在获取候选读/写指令对之后,在读指令前添... 赵银亮 王旭昊 韦远科 宋少龙文献传递