于玉龙
- 作品数:11 被引量:16H指数:2
- 供职机构:山东科技大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- GPGPU上基于运行时特征的动态并行度调度算法
- 2015年
- 调度算法对于保障GPGPU内大规模并发线程的高效运行至关重要.调度器需要根据程序的计算特征和GPGPU内各种逻辑单元的设置情况选择合理的线程并行度.然而现有调度算法或采用静态固化并行度、或调整粒度过粗,均无法在动态调整的同时保持合理的并行度参数.基于两层次调度算法TL,通过对GPGPU运行时特征的动态监测,针对细粒度Warp调度提出了结合运行时资源使用特征和指令特征的动态并行度调度算法DTL和D2TL.在性能模拟器GPGPU-Sim上的仿真实验证明,相对传统TL调度算法,DTL和D2TL分别达到平均14.4%和19.6%的性能加速.
- 于玉龙王宇新郭禾
- 关键词:GPGPU线程级并行
- 大规模并行处理器上资源与性能优化的调度方法研究
- 大规模并行处理器在空间上堆叠大量横向计算单元,通过提高并行度为许多计算带来了性能加速。以图形处理单元(Graphic Processing Unit, GPU)为硬件平台的通用计算GPU (General-purpose...
- 于玉龙
- 关键词:GPGPU调度系统
- 文献传递
- 虚拟机可瞬时开启的私有桌面云架构被引量:4
- 2015年
- 私有桌面云被广泛应用在集中计算、集中管理、远程办公等场景中。现有的私有桌面云多基于OpenStack云操作系统搭建,然而,该操作系统在使用时会出现虚拟机开启时间过长导致用户等待的问题,无法满足某些应用的高实时性要求。对此,使用模板镜像策略和网络连接存储策略作为云存储层解决方案,提出一种虚拟机可瞬时开启(ISVM)的私有桌面云架构。ISVM桌面云架构包括云管理层、云存储层、云服务层。经过测试和分析发现,ISVM私有桌面云架构的虚拟机开启时间约为OpenStack云平台虚拟机开启时间的1/100,达到了毫秒数量级,能够满足应用的实时性要求。
- 陈鑫徐义臻郭禾于玉龙罗劼王宇新
- 关键词:OPENSTACK
- 网络隔离环境下多节点接入控制技术研究被引量:2
- 2014年
- 为了保护重要数据,人们常把服务器置于内部网络与外网隔离.但实际常存在合法的外网用户需要访问内网服务器的情况.为此,采用"客户机-前置机-服务器"架构,实现内外网的隔离访问.采用数据摆渡,解决内外网的隔离通信问题;协议转换,兼容不同远程控制协议,有利于系统扩展;多节点接入控制,处理单节点宕机或多客户机接入问题,有效提高系统可靠性与性能.经过案例分析,表明该架构既能保证系统扩展性,又能保障系统的安全性和可靠性.
- 陈征陈银慧于玉龙陈鑫王宇新郭禾
- 关键词:前置机协议转换
- 波特率自适应串行通信中继器的制作方法
- 本发明一种波特率自适应串行通信中继器的制作方法属于电子通信领域,特别涉及波特率自适应通信中继器的制作方法。本发明采用第一微控制器、第二微控制器与双口RAM相连接的数据处理方式,将第一微控制器与第一波特率自适应串行通信器件...
- 邱铁江贺于玉龙
- 文献传递
- 基于自适应模板的快速人脸检测
- 针对人脸检测中常用的模板方法存在的问题,本文提出了一种自适应模板匹配方法。自适应模板方法根据图像预处理结果得到带有位置、尺寸、角度等信息的备选窗口集合,并将备选窗口的特征信息与相关的模板参数进行比较匹配。自适应模板不仅有...
- 贾棋于玉龙郭禾李豪杰
- 关键词:自适应模板人脸检测
- 文献传递
- 波特率自适应串行通信中继器的制作方法
- 本发明一种波特率自适应串行通信中继器的制作方法属于电子通信领域,特别涉及波特率自适应通信中继器的制作方法。本发明采用第一微控制器、第二微控制器与双口RAM相连接的数据处理方式,将第一微控制器与第一波特率自适应串行通信器件...
- 邱铁江贺于玉龙
- 文献传递
- 带通信开销的DAG工作流费用优化模型与算法被引量:7
- 2015年
- 通信开销在云环境中无法忽略,但现有DAG(directed acyclic graph)工作流费用优化模型大都未考虑任务之间的通信开销,难以在实际云环境中应用.为此,提出带通信开销的工作流费用优化模型CA-DAG(communication aware-DAG),并在分层算法的基础上提出针对CA-DAG模型的调度算法CACO(communication aware cost optimization).CACO使用前向一致规则(forward consistent,FC)求解工作流的最小完工时间;根据逆向分层策略将任务分层,使费用优化问题从全局转化到局部;采用动态规划方法收集任务在选择服务时产生的零散"时间碎片",增加任务的费用优化空间,改善费用优化效果.仿真实验结果表明,在考虑通信开销时,CACO费用优化效果较DTL(deadline top level),DBL(deadline bottom level),TCDBL(temporal consistency deadline bottom level)都有显著提高.
- 郭禾陈征于玉龙王宇新陈鑫
- 关键词:通信开销工作流
- 改进的协同过滤推荐算法被引量:2
- 2016年
- 协同过滤被广泛应用到个性化推荐中,本文针对传统协同过滤推荐算法准确度不高的问题进行研究,将用户之间共同评分的物品数量作为相似度计算的重要指标,并引入信任度对用户评分进行修正,提高推荐准确度。
- 于玉龙王秀芳
- 关键词:协同过滤信任度相似度电影推荐
- CUDA内存资源池设计避免访问冲突被引量:1
- 2013年
- CUDA内存资源往往存在静态申请与访问的约束,多CPU线程并发执行时会产生资源访问冲突.经建模分析发现,消除资源与设备核函数之间的静态关系可避免该问题.基于资源池模式设计CUDA内存资源池,整合多份资源副本,增加相应调度管理机制,达到了消除资源访问冲突的目的.以纹理内存为案例,在确认纹理内存线程间访问冲突存在及发生频率的基础上,设计并实现纹理内存资源池.大量实验证明资源池不但能够保证程序正确性,避免访问冲突,而且具有较小的性能损耗与负载开销,较低的代码维护成本,同时适用于多GPU系统.
- 于玉龙王宇新郭忠明唐堃郭禾
- 关键词:CUDA多线程