您的位置: 专家智库 > >

李小强

作品数:13 被引量:12H指数:2
供职机构:中国科学技术大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术电子电信天文地球更多>>

文献类型

  • 5篇期刊文章
  • 5篇专利
  • 2篇会议论文
  • 1篇学位论文

领域

  • 8篇自动化与计算...
  • 2篇电子电信
  • 1篇天文地球

主题

  • 5篇处理器
  • 3篇雷达
  • 3篇降水
  • 3篇编译器
  • 3篇并行化
  • 3篇并行性
  • 2篇单指令多数据
  • 2篇译码
  • 2篇数据处理
  • 2篇数据处理方法
  • 2篇数据流
  • 2篇数据流图
  • 2篇数据依赖
  • 2篇数据依赖关系
  • 2篇图形处理器
  • 2篇组网
  • 2篇组网雷达
  • 2篇谓词
  • 2篇流图
  • 2篇进制

机构

  • 13篇中国科学技术...
  • 2篇中国人民解放...
  • 1篇中国科学院
  • 1篇中国气象局

作者

  • 13篇李小强
  • 11篇安虹
  • 8篇刘谷
  • 5篇吴石磊
  • 5篇许牧
  • 5篇徐光
  • 3篇张倩
  • 3篇韩文廷
  • 3篇郝秀蕊
  • 2篇任永青
  • 2篇刘玉
  • 2篇周伟
  • 2篇孙涛
  • 2篇谭旭
  • 2篇周伟
  • 2篇李颀
  • 1篇汤旭龙
  • 1篇姚平
  • 1篇魏学超
  • 1篇徐恒阳

传媒

  • 2篇小型微型计算...
  • 2篇计算机科学
  • 1篇计算机工程

年份

  • 2篇2014
  • 3篇2013
  • 2篇2012
  • 2篇2011
  • 4篇2010
13 条 记 录,以下是 1-10
排序方式:
超长指令字程序的二进制翻译方法
本发明的实施例提出了一种超长指令字程序的二进制翻译方法,包括以下步骤:对程序中的超长指令字进行指令解码;还原所述程序中的控制流图以及数据流图;重建类数据流计算模型下的控制流图与数据流图;对所述程序进行超长指令字程序的二进...
安虹刘谷徐光许牧李小强韩文廷张倩刘玉
文献传递
CPU-GPU异构系统上的高层编程模型及其编译优化技术
由于具有不同的结构特点,使得CPU和GPU组成的异构系统能够更有效地处理通用计算任务。与CPU相比,GPU专注于提高需要更多的计算资源和存储带宽的数据并行任务的执行效率,具有更复杂的存储层次,且地址空间与CPU分离,使得...
李小强
关键词:编程模型
一种单指令多数据流结构上的数据处理方法及处理器
本发明公开了一种SIMD上的数据处理方法及处理器,包括:选取符合条件的处理多组数据流,指令具有包括标记位和索引位的谓词域;将指令进行译码,并获取标记位和索引位的值;利用标记位的值判断指令是否为谓词指令;当指令为谓词指令时...
安虹许牧徐光刘谷李颀任永青李小强孙涛郝秀蕊周伟谭旭
组网雷达估测降水系统并行化方案的设计与实现被引量:5
2012年
国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量,同时对实时性要求较高。如果缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序进行了热点分析和并行性分析,得出程序中有较多线程级并行性,从而制定了相应的并行化方案;然后使用Win32多线程和OpenMP两种技术对该程序在Intel四核处理器平台上进行了并行化。程序主要由单站处理和组网处理两部分组成。由于计算资源的限制,并行后的单站处理程序只有大约10%的性能提升,而组网处理程序则可以达到近似线性的性能提升。通过调整计算负载,并行化版本的加速比可以达到5.5。最后,可以得出该并行化方法适用于计算密集且数据吞吐量较大的一类应用。
吴石磊安虹李小强周伟刘谷魏学超
关键词:并行性分析OPENMP
流处理器的相变存储器主存性能优化被引量:2
2011年
将相变存储器(PCRAM)作为流处理器Imagine的主存储器,对其性能进行优化。建立(PCRAM)性能分析模型,针对PCRAM可写次数有限的缺陷,采用避免冗余位写技术,使PCRAM的生命周期延长3.4倍。利用PCRAM的非易失性,避免不必要的缓存行写回。分析访存调度算法对PCRAM性能的影响,结果表明,row/open调度算法性能较优,适合PCRAM使用。
郝秀蕊安虹李小强汤旭龙
关键词:相变存储器非易失性流处理器
一种输入感知的雷达回波快速聚类实现
2012年
聚类算法作为数据挖掘中的经典算法,在雷达回波的数据分析中经常被采用。然而对于规模和维度都较大的输入数据集,算法十分耗时。很多研究虽然对聚类算法进行了GPU平台的并行和优化的工作,但都忽略了输入数据集对优化的影响。因此,提出了在GPU/CUDA平台上的一种新颖的雷达快速聚类实现。该实现通过运行时的方式对输入的回波数据进行观察,以获取数据的分布信息,用以指导聚类计算在GPU上执行时的线程块调度。而该运行时模块本身的开销非常小。实验表明,引入这种输入感知的运行时调度支持后,大大削减了GPU的计算负载,获得了相对于一般策略的CUDA实现的20%~40%的性能提升,加强了算法的实时性能。
周伟安虹刘谷李小强吴石磊
关键词:聚类算法图形处理器统一计算设备架构
一种单指令多数据流结构上的数据处理方法及处理器
本发明公开了一种SIMD上的数据处理方法及处理器,包括:选取符合条件的处理多组数据流,指令具有包括标记位和索引位的谓词域;将指令进行译码,并获取标记位和索引位的值;利用标记位的值判断指令是否为谓词指令;当指令为谓词指令时...
安虹许牧徐光刘谷李颀任永青李小强孙涛郝秀蕊周伟谭旭
文献传递
组网雷达估测降水系统并行化方案的设计与实现
国家气象局天气组网雷达定量估测降水系统不仅拥有较大的计算量,而且具有较大的数据吞吐量。同时,对实时性要求较高。如果可以缩短其执行时间,无疑将会带来巨大的收益。鉴于这些特点,使用VTune Amplifer XE对串行程序...
吴石磊安虹李小强
关键词:并行性分析降水系统
图广度优先搜索算法面向图形处理器的优化方法研究被引量:2
2014年
近年来,图形处理器(GPU)以其丰富的计算资源和低廉的成本逐渐在高性能计算领域取得一席之地,对于具有规则访存特性的并行程序具有明显的加速作用.但是以图广度优先搜索(BFS)算法为代表的某些不规则应用,在图形处理器上性能表现平平.为了解决不规则程序在图形处理器上的性能瓶颈问题必须分析其行为特征,面向特定体系结构提出有针对性的程序优化方法.本文通过分析图广度优先搜索算法的在GPU上的并行性模式,访存特性以及工作负载,提出了基于并行性剖析与反馈的计算资源重配置方法,动态队列的层次优化方法,以及线程级负载平衡方法.实验表明以上优化方法能够显著提高图广度优先搜索算法为代表的不规则程序在GPU上的性能.
刘谷安虹李小强吴石磊
关键词:图形处理器
超长指令字程序的二进制翻译方法
本发明的实施例提出了一种超长指令字程序的二进制翻译方法,包括以下步骤:对程序中的超长指令字进行指令解码;还原所述程序中的控制流图以及数据流图;重建类数据流计算模型下的控制流图与数据流图;对所述程序进行超长指令字程序的二进...
安虹刘谷徐光许牧李小强韩文廷张倩刘玉
共2页<12>
聚类工具0