徐恒阳
- 作品数:4 被引量:8H指数:2
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家科技重大专项国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- Pview:一种基于PMU的支持并行程序性能分析的新方法被引量:4
- 2011年
- 近年来,随着并行编程的普及,性能监测和剖析已经成为计算机系统领域最重要的研究课题之一。PMU(Performance Monitoring Unit),即现代处理器里集成的微体系事件性能计数器,为性能监测提供了底层支持,使得在以极小的额外开销和极少的对目标程序的干扰的情况下对程序进行性能监测成为可能。Pview(Performance View)是一种在系统级支持对并行程序尤其是多线程程序进行性能监测与分析的工具,它同时支持全系统和针对特定进程(线程组)的性能事件直接计数或者抽样的分析方法。Pview在Linux操作系统平台上通过扩展内核2.6.30,实现了一个新的系统调用Pview来提供性能监测服务;同时与以模块方式实现的数据收集引擎协作,可以实现抽样并将大规模样本数据传输到用户空间供进一步分析。
- 闫洁徐恒阳安虹刘玉王耀彬
- 关键词:性能监测
- 基于主辅数据结构的CPU-GPU合作计算方法
- 本发明的实施例提出了一种基于主辅数据结构的CPU-GPU合作计算方法,包括以下步骤:根据处理的对象,确定主辅数据内容并进行初始化;启动CPU计算线程和GPU计算线程;读入待处理的数据,经过预处理后存储至主辅数据结构中,同...
- 安虹姚平刘谷徐光许牧李小强韩文廷张倩徐恒阳
- 文献传递
- Perf在龙芯2F上的设计与实现被引量:1
- 2011年
- 在龙芯2F平台上设计并实现性能调优工具Perf。分析Perf的实现原理,针对龙芯修改Perf内核层中体系相关部分代码,设计硬件性能计数器的操作函数集和溢出中断处理函数。使用Perf分析矩阵相乘测试用例,结果表明Perf得到的采样结果接近理论值,与Oprofile相比,采样数据更精确。
- 徐恒阳安虹刘玉周伟
- 关键词:性能计数器前端
- 龙芯多核平台上性能分析工具的设计与实现
- 近年来,片上多核处理器成为主流,国产芯片龙芯也推出了四核处理器-龙芯3A。为了充分利用多核处理器的片上资源,使多核处理器的硬件资源转变为程序性能的提升,并行程序设计变得越来越重要。并行程序一直是程序设计的难点,从串行程序...
- 徐恒阳
- 关键词:多核处理器操作系统性能分析软件架构