陈顼颢 作品数:13 被引量:29 H指数:3 供职机构: 国防科学技术大学计算机学院 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 国防科技大学优秀研究生创新基金 更多>> 相关领域: 自动化与计算机技术 更多>>
二进制翻译中代码生成的子图覆盖算法 被引量:1 2011年 二进制翻译技术能够有效解决二进制兼容问题,促进新型体系结构的发展,也是虚拟机技术的重要组成部分,具有重要的研究和应用价值,但是其效率仍然有待提升,特别是目标代码生成的效率。设计了一种高效的目标代码生成算法——代码生成的子图覆盖算法(subgraph covering for code generation,SCCG),能够以尽可能少的代价生成精简的目标代码。该算法应用数据流图对二进制代码中的基本块进行建模,获取指令间的数据相关,并采用基于子图覆盖的贪心算法得到目标代码。在TransARM原型系统中进行了实现和测试,结果表明该算法获得了更优质的目标代码,并且成本得到了有效控制。 陈顼颢 郑重 沈立 王志英关键词:二进制翻译 代码生成 一种新型病毒主动防御技术与检测算法 被引量:9 2010年 在已有的病毒行为分析和模式识别技术的基础上,提出以用户行为模式为核心的主动防御策略,即识别用户的正常行为模式,在检测到异常行为时,判断出系统是否遭受到了恶意攻击。这种策略不依赖于恶意程序的繁衍和变迁,可以使防御技术不受制于恶意程序。对该防御策略进行了实现,并在虚拟执行环境下进行了实验,实验结果表明,该策略对未知病毒有较高的识别度。 陈顼颢 王志英 任江春 郑重 黄訸关键词:主动防御 模式识别 多处理器平台下的动态二进制翻译方法 本发明公开了一种多处理器平台下的动态二进制翻译方法。目的是提供一种利用操作系统缺页中断机制实现翻译控制的方法。技术方案是先搭建由多个处理器组成的硬件平台,然后设计翻译软件,由翻译软件负责二进制代码的转换;接着实现动态二进... 王志英 徐帆 沈立 赖鑫 陈微 陈顼颢 郑重 温家辉 郭辉文献传递 支持动态二进制翻译的多核体系结构 本发明公开了一种支持动态二进制翻译的多核体系结构,目的是解决动态二进制翻译过程中的Cache访问冲突和主存冲突等问题。本发明由多个处理器核、一级Cache、翻译缓存单元、二级Cache和主存控制器组成。一级Cache、翻... 王志英 赖鑫 沈立 徐帆 陈微 陈顼颢 郑重 朱天龙 陆华俊 游良帅文献传递 基于病毒行为序列的未知病毒分析技术研究 被引量:3 2010年 提出了一种在虚拟执行技术支持下基于病毒行为序列的未知病毒分析检测技术。该技术可以克服病毒特征代码扫描法不能识别未知病毒的特点。在模拟的虚拟执行环境中对该方法进行了测试,测试表明了该方法的可行性和较高的准确性。 郑重 王志英 陈顼颢 黄訸关键词:计算机病毒 病毒检测 浮点到定点的高效翻译策略研究 2011年 动态二进制翻译中,在目标平台没有浮点部件、不支持浮点运算的情况下,浮点指令只能通过模拟解释执行。浮点指令的解释执行造成翻译系统效率急剧下降。通过将浮点指令运算转化为定点运算,解决了浮点指令在目标平台的翻译,为浮点指令的翻译找到了新的途径。在动态二进制翻译系统中进行实验,验证了翻译方法的可行性。实验显示翻译系统的性能有明显提升,含有浮点指令的比例越高,算法能够获得的加速比越高,对含有25%浮点指令的程序,该算法能达到1.55的加速比。 郑重 陈顼颢 沈立 王志英关键词:动态二进制翻译 浮点 一种基于GPU的高性能稀疏卷积神经网络优化 被引量:2 2018年 卷积神经网络CNN目前作为神经网络的一个重要分支,相比于其他神经网络方法更适合应用于图像特征的学习和表达。随着CNN的不断发展,CNN将面临更多的挑战。CNN参数规模变得越来越大,这使得CNN对计算的需求量变得非常大。因此,目前产生了许多种方式对CNN的规模进行压缩。然而压缩后的CNN模型往往产生了许多稀疏的数据结构,这种稀疏结构会影响CNN在GPU上的性能。为了解决该问题,采用直接稀疏卷积算法,来加速GPU处理稀疏数据。根据其算法特点将卷积运算转换为稀疏向量与稠密向量内积运算,并将其在GPU平台上实现。本文的优化方案充分利用数据稀疏性和网络结构来分配线程进行任务调度,利用数据局部性来管理内存替换,使得在稀疏卷积神经网络SCNN中的GPU仍能够高效地处理卷积层运算。相比cuBLAS的实现,在AlexNet、GoogleNet、ResNet上的性能提升分别达到1.07×~1.23×、1.17×~3.51×、1.32×~5.00×的加速比。相比cuSPARSE的实现,在AlexNet、GoogleNet、ResNet上的性能提升分别达到1.31×~1.42×、1.09×~2.00×、1.07×~3.22×的加速比。 方程 邢座程 陈顼颢 张洋关键词:卷积神经网络 图形处理器 多处理器平台下的动态二进制翻译方法 本发明公开了一种多处理器平台下的动态二进制翻译方法。目的是提供一种利用操作系统缺页中断机制实现翻译控制的方法。技术方案是先搭建由多个处理器组成的硬件平台,然后设计翻译软件,由翻译软件负责二进制代码的转换;接着实现动态二进... 王志英 徐帆 沈立 赖鑫 陈微 陈顼颢 郑重 温家辉 郭辉单节点多GPU集群下HPL动态负载均衡优化 被引量:3 2013年 现有GPU加速的高性能Linpack基准测试程序(HPL)一般采用基于实际运算能力的动态负载均衡算法来实现。然而该算法在单节点多GPU的平台上表现不佳,其原因是单节点多GPU平台上单个GPU计算量小,并且GPU与CPU的总性能差距较大。为此,提出了经验指导的动态负载均衡算法以及多GPU自适应负载均衡算法,并且在单节点多GPU平台上进行了验证,结果显示,其比现有的基于NVIDIA费米GPU的HPL有6.3%的加速效果。 陈任之 黄立波 陈顼颢 王志英关键词:HPL GPU 动态负载均衡算法 支持动态二进制翻译的多核体系结构 本发明公开了一种支持动态二进制翻译的多核体系结构,目的是解决动态二进制翻译过程中的Cache访问冲突和主存冲突等问题。本发明由多个处理器核、一级Cache、翻译缓存单元、二级Cache和主存控制器组成。一级Cache、翻... 王志英 赖鑫 沈立 徐帆 陈微 陈顼颢 郑重 朱天龙 陆华俊 游良帅