国家自然科学基金(60574065)
- 作品数:12 被引量:29H指数:3
- 相关作者:殷保群郑烇马军江琦奚宏生更多>>
- 相关机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信理学更多>>
- 一种基于负载均衡的数据部署算法被引量:2
- 2009年
- 针对采用分片存储方式且存储节点异构的媒体分发网络(Media Delivery Network,MDN),提出一种数据部署算法,使分布式节点之间达到负载均衡。算法为每个存储节点定义一个权值来描述其服务能力,通过一种反馈机制,即根据各存储节点偏离平衡状态的程度,来选择要部署数据的节点。实验结果表明:使用算法,不仅在数据增加、删除以及增删混合时,可使系统达到一个较低的负载不均衡度,而且对于各种原因导致的系统负载失衡,经过足够长的时间,都能使系统的负载不均衡度收敛到一个较小的数值。
- 李洪亮殷保群郑烇
- 关键词:媒体分发网络负载均衡
- 非线性采样观测器的误差分析
- 2008年
- 通过分析非线性系统采样观测器的误差,给出了观测器误差一致最终有界的条件,估算了误差的最终边界.分析结果表明,采样周期固定时,选择精度更高的数值方法可以减小观测器的误差.
- 金辉宇殷保群唐波
- 关键词:非线性系统一致最终有界
- 一类分层非结构化P2P系统的随机优化
- 2007年
- 对于一类利用中心式构架和分布式构架各自优点的分层非结构化P2P系统,通过定义一种Markov切换空间模型来描述其动态组划分切换行为,从而导出相应的系统性能优化问题,同时还在Markov决策过程理论的基础上给出了关于性能指标的参数化梯度优化算法,并通过相应的实例仿真验证了算法的有效性。
- 徐陈锋奚宏生江琦殷保群
- 关键词:MARKOV决策过程
- 基于观测的POMDP优化算法及其仿真被引量:1
- 2008年
- 在分析马尔可夫决策过程(Markov Decision Process,MDP)性能灵敏度的基础上,讨论了部分可观测马尔可夫决策过程(Partially Observable Markov Decision Process,POMDP)的性能优化问题.给出了POMDP性能灵敏度分析公式,并以此为基础提出了两种基于观测的POMDP优化算法:策略梯度优化算法和策略迭代优化算法.最后以准许控制问题为仿真实例,验证了这两个算法的有效性.
- 黄静殷保群李俊
- 关键词:仿真
- 基于POMDP模型的机器人行动的仿真优化被引量:1
- 2008年
- 策略梯度优化算法是一种很重要的强化学习算法,对实现机器人的自主导航有着重要的应用价值。在部分可观Markov决策过程(POMDP)的基础上,实现了两个有限记忆的策略梯度优化算法:基于模型的GAMP算法和无模型的IState-GPOMDP算法,并利用该算法对机器人走迷宫的问题进行了仿真。通过分析仿真结果,对这两种算法引入了基于观测的优化;并发现在所给报酬函数下,策略梯度算法中的步长参数也在一定程度上影响着优化策略的效率。
- 马军殷保群
- 关键词:POMDP
- 基于CDN和P2P的分布式网络存储系统被引量:7
- 2010年
- 把用户的文件分片后均衡存储在不同的分布式存储节点上,并利用虚拟目录服务器和基于P2P-DHT的目录服务器把文件元数据与文件数据片高效地对应起来,以提供高效目录服务,分布式存储节点以P2P方式工作以快速完成用户对文件数据的请求任务。分布式网络存储系统DNSS充分利用了CDN和P2P的技术优势,有较高的可用性、可靠性和可扩展性。DNSS已经在中国科学技术大学应用。
- 马军郑烇殷保群
- 关键词:分布式存储P2PDHT
- 连续时间部分可观Markov决策过程的策略梯度估计被引量:1
- 2009年
- 针对连续时间部分可观Markov决策过程(CTPOMDP)的优化问题,本文提出一种策略梯度估计方法.运用一致化方法,将离散时间部分可观Markov决策过程(DTPOMDP)的梯度估计算法推广到连续时间模型,研究了算法的收敛性和误差估计问题,并用一个数值例子来说明该算法的应用.
- 唐波李衍杰殷保群
- 关键词:误差界
- 基于双层P2P架构的VoD系统
- 2008年
- 本文提出的视频点播系统基于双层P2P架构实现,由城域网与驻地网媒体内容分发构成2级数据分发服务平台,用户终端点播并接受视频服务的同时,还能为其他用户提供数据服务,双层P2P架构有效地扩展了系统带宽,增强了服务能力,降低了系统成本,并提供QoS保证。
- 王嵩郑烇凌强吴刚
- 关键词:P2PVOD
- 动态电源管理的随机切换模型与在线优化被引量:8
- 2007年
- 考虑系统参数未知情况下的动态电源管理问题,提出一种基于强化学习的在线策略优化算法.通过建立事件驱动的随机切换分析模型,将动态电源管理问题转化为带约束的Markov决策过程的策略优化问题.利用此模型的动态结构特性,结合在线学习估计梯度与随机逼近改进策略,提出动态电源管理策略的在线优化算法.随机切换模型对电源管理系统的动态特性描述精确,在线优化算法自适应性强,运算量小,精度高,具有较高的实际应用价值.
- 江琦奚宏生殷保群
- 关键词:动态电源管理MARKOV决策过程梯度估计
- 一类分层非结构化P2P系统的随机优化
- 对于一类利用中心式构架和分布式构架各自优点的分层非结构化P2P系统,通过定义一种Markov切换空间模型来描述其动态组划分切换行为,从而导出相应的系统性能优化问题.同时还在Markov决策过程理论的基础上给出了关于性能指...
- 徐陈锋奚宏生江琦殷保群
- 关键词:MARKOV决策过程
- 文献传递