您的位置: 专家智库 > >

安徽高校省级自然科学研究基金(KJ2007A063)

作品数:2 被引量:0H指数:0
相关作者:唐昊周雷程文娟李豹程燕更多>>
相关机构:合肥工业大学更多>>
发文基金:国家自然科学基金安徽省自然科学基金安徽高校省级自然科学研究基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇会议论文
  • 2篇期刊文章

领域

  • 5篇自动化与计算...

主题

  • 3篇Q学习
  • 2篇MDP
  • 2篇性能势
  • 1篇带宽
  • 1篇带宽和
  • 1篇对等
  • 1篇学习算法
  • 1篇遗传算法
  • 1篇跳数
  • 1篇鲁棒
  • 1篇鲁棒控制
  • 1篇鲁棒控制策略
  • 1篇路由
  • 1篇路由问题
  • 1篇马尔可夫
  • 1篇马尔可夫决策...
  • 1篇接入
  • 1篇接入控制
  • 1篇控制策略
  • 1篇呼叫

机构

  • 5篇合肥工业大学

作者

  • 5篇周雷
  • 5篇唐昊
  • 1篇吴慧
  • 1篇程燕
  • 1篇李豹
  • 1篇程文娟
  • 1篇丁丽洁

传媒

  • 2篇系统仿真学报
  • 1篇2007系统...
  • 1篇第二十六届中...

年份

  • 1篇2009
  • 2篇2008
  • 2篇2007
2 条 记 录,以下是 1-5
排序方式:
基于对等SAP的Q学习在机器人作业分配中的应用
基于强化学习,文章讨论了高速搬运系统中多个机器人的作业分配问题。针对状态空间随机器人个数增加呈指数增大这一难题,提出对等状态-行动对(State-Action Pair)概念,设计了一种改进的Q学习算法。在该算法中,每次...
丁丽洁唐昊周雷
关键词:Q学习
文献传递
多链MDP的鲁棒控制策略求解
2008年
马尔可夫决策过程(MDP)的许多优化算法一般依赖系统的转移速率,而系统参数的不确定性使得MDP的转移速率往往很难精确得知。针对一类不确定多链MDP模型,基于性能势对参数不相关和相关两种情况下的鲁棒控制问题进行了探讨,并分别给出求解系统最优鲁棒性能的策略迭代和并行遗传算法。最后,通过一个数值例子分析相关算法的有效性。
周雷唐昊程燕
关键词:性能势鲁棒控制并行遗传算法
基于带宽和路径跳数的CAC和路由问题的控制策略
在QoS框架下研究呼叫接入控制和路由问题的控制策略,探讨呼叫接纳准则和路径选择策略,以降低新呼叫拒绝率和提高网络资源的利用率。本文结合可用带宽资源和路径跳数定义一个评价函数,给出了一种基于阈值接纳和概率择路的CAC和Ro...
周雷唐昊
关键词:呼叫接入控制路由跳数
文献传递
CSPS模型基于Q学习的Look-Ahead控制
探讨基于 Look-Ahead 控制的传送带服务生产加工站(Conveyor-Serviced Production Station,CSPS)的优化控制问题。通过建模为半 Markov 决策过程(SMDP),基于性能势...
吴慧唐昊周雷
关键词:LOOK-AHEADQ学习
文献传递
一种MDP基于性能势的并行Q学习算法
2009年
在性能势理论框架内,研究折扣和平均准则马尔可夫决策过程(MDP)的统一并行Q学习算法。提出了独立并行Q学习算法和状态划分并行Q学习算法,重点讨论了算法中的关键参数的设计,即同步点如何选择的同步策略和如何合成Q因子的Q值构建策略,给出了一种固定步长结合一定偏移量的同步策略,并分析了并行中Q值构建策略的确定原则,给出了几种Q值构建策略的选择方法。仿真实验表明并行Q学习算法的有效性。
程文娟唐昊李豹周雷
关键词:Q学习马尔可夫决策过程性能势
共1页<1>
聚类工具0