您的位置: 专家智库 > >

国家高技术研究发展计划(2010AA012301)

作品数:9 被引量:14H指数:2
相关作者:迟学斌曹宗雁刘鑫莫则尧徐小文更多>>
相关机构:中国科学院江南计算技术研究所中国科学院研究生院更多>>
发文基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术理学水利工程天文地球更多>>

文献类型

  • 9篇中文期刊文章

领域

  • 6篇自动化与计算...
  • 2篇理学
  • 1篇天文地球
  • 1篇水利工程

主题

  • 1篇地表
  • 1篇地表气温
  • 1篇地下径流
  • 1篇地下水
  • 1篇地下水补给
  • 1篇第一性原理
  • 1篇刑侦
  • 1篇性能分析
  • 1篇映射
  • 1篇预处理
  • 1篇掌纹
  • 1篇掌纹识别
  • 1篇掌纹识别技术
  • 1篇识别技术
  • 1篇搜索
  • 1篇特征点
  • 1篇特征值
  • 1篇特征值问题
  • 1篇通信优化
  • 1篇排序

机构

  • 5篇中国科学院
  • 2篇江南计算技术...
  • 2篇中国科学院研...
  • 1篇北京应用物理...
  • 1篇中国科学院大...
  • 1篇北京市刑事科...
  • 1篇中国科学院大...

作者

  • 3篇曹宗雁
  • 3篇迟学斌
  • 2篇刘鑫
  • 1篇付继芸
  • 1篇王龙
  • 1篇刘青凯
  • 1篇秦佩华
  • 1篇安恒斌
  • 1篇陆林生
  • 1篇徐小文
  • 1篇莫则尧
  • 1篇赵毅
  • 1篇牛铁
  • 1篇贾伟乐
  • 1篇阚圣哲
  • 1篇陈德训
  • 1篇吴春生
  • 1篇赵春
  • 1篇叶煌
  • 1篇朱鹏

传媒

  • 1篇计算机应用与...
  • 1篇计算机应用
  • 1篇计算机应用研...
  • 1篇计算物理
  • 1篇数值计算与计...
  • 1篇计算机科学
  • 1篇Advanc...
  • 1篇科研信息化技...
  • 1篇中国科学院大...

年份

  • 1篇2014
  • 3篇2013
  • 3篇2012
  • 2篇2011
9 条 记 录,以下是 1-9
排序方式:
FGOALS性能优化技术研究
2013年
中国科学院大气物理研究所气候系统模式FGOALS是一个灵活的全球"海洋-大气-陆面-海冰"完全耦合的、"非通量订正"的环流模式。通过对FGOALS的性能分析数据,研究提高数据访问局部性、增加程序向量化率、消除冗余计算以及并行通信优化等优化方法。实验结果表明,优化后模式在神威高性能计算机系统上部分核心函数性能加速1.2-1.8倍,部分通信函数性能加速3-3.3倍。
赵春刘鑫
关键词:FGOALS性能分析
非结构网格并行计算预处理方法研究被引量:5
2012年
非结构网格预处理方法是非结构网格CFD并行计算的关键技术之一。提出基于缓冲数据结构的快速搜索算法来建立全局网格单元邻接关系图,算法复杂度低,能够显著降低非结构网格预处理的存储需求;在提高核心计算访存命中率方面,提出网格单元重排序算法,该算法能够提高核心计算效率,并通用于各种非结构网格问题。实验结果表明,在用于大网格量的复杂计算区域时该非结构网格预处理技术仍能得到较理想的结果。
刘鑫陆林生陈德训
关键词:非结构网格预处理快速搜索
Incorporating Groundwater Dynamics and Surface/Subsurface Runoff Mechanisms in Regional Climate Modeling over River Basins in China被引量:1
2013年
To improve the capability of numerical modeling of climate-groundwater interactions, a groundwater component and new surface/subsurface runoff schemes were incorporated into the regional climate model RegCM3, renamed RegCM3 Hydro. 20-year simulations from both models were used to investigate the effects of groundwater dynamics and surface/subsurface runoff parameterizations on regional climate over seven river basins in China. A comparison of results shows that RegCM3 Hydro reduced the positive biases of annual and summer (June, July, August) precipitation over six river basins, while it slightly increased the bias over the Huaihe River Basin in eastern China. RegCM3 Hydro also reduced the cold bias of surface air temperature from RegCM3 across years, especially for the Haihe and the Huaihe river basins, with significant bias reductions of 0.80℃ and 0.88℃, respectively. The spatial distribution and seasonal variations of water table depth were also well captured. With the new surface and subsurface runoff schemes, RegCM3 Hydro increased annual surface runoff by 0.11-0.62 mm d-1 over the seven basins. Though previous studies found that incorporating a groundwater component tends to increase soil moisture due to the consideration of upward groundwater recharge, our present work shows that the modified runoff schemes cause less infiltration, which outweigh the recharge from groundwater and result in drier soil, and consequently cause less latent heat and more sensible heat over most of the basins.
秦佩华谢正辉袁星
关键词:区域气候模拟河流流域地表气温流机制地下水补给地下径流
GPU集群下第一原理非局部映射势能计算
2013年
平面波赝势密度泛函(PWP-DFT)计算是材料计算中应用最广泛的方法,其中映射计算是PWP-DFT方法求解自洽迭代中重要的一部分。针对映射势能计算成为软件加速的瓶颈,提出了针对该部分的图形处理器(GPU)加速算法,其中考虑GPU的特点:1)使用了新的并行机制求解非局部映射势能;2)重新设计了数据分布结构;3)减少内存的使用;4)提出了一种解决算法中数据相关问题的方法。最终获得了18~57倍加速,使每步分子动力学模拟最终降为12 s。详细分析了该模块在GPU平台上的测试时间,同时对该算法在GPU集群上的计算瓶颈进行了讨论。
付继芸贾伟乐曹宗雁王龙叶煌迟学斌
关键词:第一性原理密度泛函理论GPU加速
众核GPU上双调归并排序的优化
2011年
编写了基于OpenCL的双调归并排序程序,保留了双调归并排序算法消耗存储空间小的优点,利用算法中数据局部性特点减少程序中CPU同步的次数,使用向量计算以提升ALU使用率,并对读写访存进行了优化。程序能够运行于支持OpenCL和向量计算的显卡和处理器上。不统计PCI-E总线数据传输时间,223规模的整数排序的性能在HD6870显卡上能达到0.276GB/s。
阚圣哲曹宗雁
关键词:OPENCLGPU向量
自适应结构网格上扩散方程隐式时间积分算法及其应用被引量:6
2012年
提出一种自适应结构网格(SAMR)上求解扩散方程的隐式时间积分算法.该算法从粗网格到细网格逐层进行时间积分,通过多层迭代同步校正保证粗细界面的流连续和计算区域的扩散平衡.分析算法复杂度,并给出评估算法低复杂度的准则.典型算例表明,相对于一致加密情形,本文算法能够在保持相同计算精度的前提下,大幅度降低网格规模和计算量,且具有低复杂度.将算法应用于辐射流体力学数值模拟中非线性扩散方程组求解,相对于一致加密网格,SAMR计算将计算量下降一个量级以上,计算效率提高33.2倍.
徐小文莫则尧刘青凯安恒斌
关键词:辐射流体力学
刑侦领域高分辨率掌纹识别技术及快速匹配方法被引量:1
2014年
针对公安机关特别是刑侦领域的掌纹自动识别技术需求,讨论基于高分辨率的掌纹细节特征点识别方法必要性.将细节特征点匹配方法作为重点,以Cafis指掌纹系统为例,分析掌纹细节特征点匹配算法的瓶颈,并与传统硬件并行和最新的GPU并行等提高掌纹比对速度的技术方法进行对比.
吴春生冯才刚迟学斌
关键词:刑侦掌纹识别高分辨率细节特征点
非光滑区域上椭圆型特征值问题的间断有限元方法应用
2012年
本文针对非光滑区域上椭圆特征值特征值问题利用间断有限元方法(DG)近似.利用大量的数值算例发现,DG方法对非光滑区域(凹角,裂缝等问题)上Laplace特征值问题的近似比协调有限元、非协调元(如C-R元),甚至比有限元校正格式有着更好的效果.
秦佩华
关键词:间断有限元椭圆型方程特征值问题非光滑区域
基于通信优化的Infiniband集群MPI作业加载被引量:1
2011年
针对如何缓解Infiniband集群中因通信冲突引起的MPI程序性能下降问题进行了研究,从系统管理的角度出发,提出了通过改变进程映射来优化MPI作业加载方案从而优化应用程序通信性能的方法,设计了用于评价MPI作业加载方案的通信性能损失系数(CPLR)指标,基于模拟退火算法设计了优化加载方案的搜索算法,并对所提出的指标和算法进行了实现和测试。测试结果表明,经过优化加载后的MPI程序在通信性能上有一定程度的提高。
曹宗雁牛铁赵毅朱鹏迟学斌
关键词:高性能计算机INFINIBAND集群MPI通信优化
共1页<1>
聚类工具0