您的位置: 专家智库 > >

国家高技术研究发展计划(2007AA01Z116)

作品数:9 被引量:10H指数:2
相关作者:车永刚王正华徐传福方建滨翁玉芬更多>>
相关机构:国防科学技术大学并行与分布处理国防科技重点实验室漯河职业技术学院更多>>
发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 8篇期刊文章
  • 1篇会议论文

领域

  • 9篇自动化与计算...

主题

  • 2篇映射
  • 2篇映射方法
  • 2篇通信优化
  • 2篇负载平衡
  • 2篇TRACE
  • 1篇迭代
  • 1篇多核
  • 1篇多核集群
  • 1篇性能分析
  • 1篇性能模拟
  • 1篇遗传算法
  • 1篇任务映射
  • 1篇体系结构
  • 1篇通信
  • 1篇通信性能
  • 1篇踪迹
  • 1篇位函数
  • 1篇系统性能
  • 1篇流编程模型
  • 1篇流处理器

机构

  • 8篇国防科学技术...
  • 1篇漯河职业技术...
  • 1篇并行与分布处...

作者

  • 9篇王正华
  • 9篇车永刚
  • 6篇徐传福
  • 4篇翁玉芬
  • 4篇方建滨
  • 1篇曹维
  • 1篇王荣
  • 1篇陆平静

传媒

  • 4篇计算机工程与...
  • 2篇计算机工程
  • 1篇国防科技大学...
  • 1篇计算机科学

年份

  • 1篇2012
  • 2篇2010
  • 6篇2009
9 条 记 录,以下是 1-9
排序方式:
基于并行模拟的多核集群系统性能预测和分析被引量:6
2010年
针对多核集群系统所表现出的新的性能特征,提出了面向多核集群系统消息传递应用程序的并行模拟模型并设计、实现了一个并行模拟器MCPSim(Multi-core Cluster Parallel Simulator),MCPSim在功能模型和性能模型上体现了片内核间、结点内片间以及结点间等三个层次上消息通信的特点,同时支持对应用的消息数量、通信量等的百分比分布的profiling功能,采用PRIMEJ、acobi3D、NPB IS以及HPL等Benchmark程序对MCPSim进行了测试,结果表明MCPSim性能预测的精度优于BigSim,同时能够广泛应用于针对多核集群系统消息传递应用程序的性能分析中。
徐传福车永刚王正华
关键词:多核集群
地球引力位函数在流处理器上的实现与分析
2009年
流处理器是新型高性能微处理器的代表之一。该文通过分析Imagine流处理器体系结构,实现某卫星轨道预报系统核心子程序CBPTRB,对基于Imagine的钟精确模拟器ISim进行性能测试,并将结果与该程序在普通x86处理器上的性能进行对比,同时根据实验结果提出改进方法。
曹维车永刚王正华
关键词:流编程模型
一种Trace驱动的多核SMP集群并行性能模拟方法
2009年
基于新型多核SMP集群的层次化性能模型,本文在BigSim并行性能模拟器基础上实现了一个Trace驱动的多核SMP集群并行性能模拟器Sim-MSC。在一个InfiniBand多核SMP集群的宿主机平台上采用jacobi3D程序进行了测试,结果表明Sim-MSC能够模拟MPI消息传递并行应用程序在多核SMP集群上的执行特征,精确预测系统和应用性能。
翁玉芬徐传福车永刚方建滨王正华
Trace生成对大规模并行性能模拟的影响及其改进策略
2012年
Trace生成是trace驱动体系结构模拟中不可或缺的步骤。Trace不仅需要占用大量存储空间,其生成过程还可能对目标应用程序的模拟执行产生一定程度的干扰,导致性能数据误差。Trace驱动并行性能模拟器由于其设计实现特点和所运行的宿主并行平台的多样性,使得trace生成的影响具有其独特性。本文选取典型并行模拟器BigSim和若干具有不同计算通信比的目标并行程序,在三个支持不同traceI/O方式的宿主机平台上设计实验评估了trace生成对并行性能模拟的影响,结果表明trace生成对模拟效率和精度均有较大的影响,并分析了这种影响与并行模拟器实现和宿主机平台I/O方式的关系,进而讨论了几种可行的改进方案,对trace驱动并行模拟器设计、实现和使用具有一定的指导意义。
徐传福王荣车永刚王正华
关键词:踪迹体系结构
结合模型和迭代编译优化矩阵相乘程序被引量:1
2009年
高性能计算应用程序获得的持续性能与机器峰值性能的差距日益扩大,很大程度上制约着高性能计算的发展。程序变换通过对程序进行适应机器体系结构特征的优化变换,提高程序实际执行性能,是解决该问题的有效途径之一。很多高级程序变换均具有数值参数,为了获得最优性能,需要仔细选择参数的值。传统的编译器使用简单的模型选择这些参数,难以适应日趋复杂的硬件平台和应用程序。迭代编译通过生成不同的程序版本并在实际硬件评估上运行程序,来评估关键优化参数的值并决定能够产生最优性能的值,显著优于静态方法,但巨大的优化开销限制了其应用范围。本文针对矩阵相乘程序提出一种结合性能模型和迭代编译的优化方法,利用基于对机器体系结构和程序的经验知识构造性能模型约束优化空间,并使用遗传算法加速在优化空间中寻找优秀解的过程。实验结果表明,该方法可以较低的开销获得更优的性能优化效果。
陆平静王正华车永刚
关键词:遗传算法
一种并行性能模拟中LP到PP的高效映射方法
2009年
LP到PP的高效映射是加速并行性能模拟的关键技术之一。针对交互规则的并行应用程序,设计映射生成方法A2-LP3M从Trace中提取LP间的交互模式,以宿主机物理进程间通信最小化为目标,兼顾计算负载平衡,从循环块映射中选取合适的映射方式。实验表明,相对于常规映射方法,A2-LP3M减少并行模拟时间最多可达16.2%。
方建滨徐传福车永刚翁玉芬王正华
关键词:映射通信优化负载平衡
基于Trace的并行性能模拟任务映射方法
2010年
针对Trace驱动的并行性能模拟问题,提出基于Trace信息指导的映射方法CO-LP3M。CO-LP3M利用从Trace中提取的目标应用程序的通信特征,以宿主机物理进程间通信次数最小化为目标,兼顾计算负载均衡,生成并行模拟任务到宿主机的映射。对HPL程序进行实验,结果表明CO-LP3M可有效提高并行模拟性能,相对于常见的映射方式,模拟性能最多提高14.7%。在此基础上给出CO-LP3M的扩展技术SCO-LP3M。
方建滨徐传福车永刚翁玉芬王正华
关键词:任务映射通信优化负载平衡
大规模并行计算机系统并行性能模拟技术研究被引量:2
2009年
性能模拟技术是计算机系统性能评价的重要手段。介绍了面向大规模并行计算机系统以及消息传递应用程序的并行性能模拟技术,总结了相关的关键技术和国内外研究现状。对几个代表性的并行模拟器系统进行了详细介绍。结合并行计算机系统和应用的发展趋势,讨论了未来并行模拟器设计、实现面临的问题和可能的解决方案。
徐传福车永刚王正华
关键词:并行计算机
All-to-all在千兆以太网集群上的性能分析
MPI-Alltoall全交换操作是集群中常用的集合通信操作之一,针对该操作有多种实现算法。不同的实现算法在具体的物理平台具有不同的性能。本文在目前应用较广的千兆以太网集群平台,分析并对比测试了不同算法的通信性能,为进一...
翁玉芬方建滨车永刚王正华
关键词:通信性能
文献传递
共1页<1>
聚类工具0