公共文化服务平台

2024年8月4日星期日

|

欢迎来到青海省图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

安徽高校省级自然科学研究基金(KJ2007A063): 作品数：2 被引量：0H指数：0; 相关作者：唐昊周雷程文娟李豹程燕更多>>; 相关机构：合肥工业大学更多>>; 发文基金：国家自然科学基金安徽省自然科学基金安徽高校省级自然科学研究基金更多>>; 相关领域：自动化与计算机技术更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

3篇会议论文
2篇期刊文章

领域

5篇自动化与计算...

主题

3篇Q学习
2篇MDP
2篇性能势
1篇带宽
1篇带宽和
1篇对等
1篇学习算法
1篇遗传算法
1篇跳数
1篇鲁棒
1篇鲁棒控制
1篇鲁棒控制策略
1篇路由
1篇路由问题
1篇马尔可夫
1篇马尔可夫决策...
1篇接入
1篇接入控制
1篇控制策略
1篇呼叫

机构

5篇合肥工业大学

作者

5篇周雷
5篇唐昊
1篇吴慧
1篇程燕
1篇李豹
1篇程文娟
1篇丁丽洁

传媒

2篇系统仿真学报
1篇2007系统...
1篇第二十六届中...

年份

1篇2009
2篇2008
2篇2007

共 2 条记录，以下是 1-5

全选清除导出

排序方式：

基于对等SAP的Q学习在机器人作业分配中的应用: 基于强化学习,文章讨论了高速搬运系统中多个机器人的作业分配问题。针对状态空间随机器人个数增加呈指数增大这一难题,提出对等状态-行动对（State-Action Pair）概念,设计了一种改进的Q学习算法。在该算法中,每次...; 丁丽洁唐昊周雷; 关键词：Q学习; 文献传递

多链MDP的鲁棒控制策略求解: 2008年; 马尔可夫决策过程(MDP)的许多优化算法一般依赖系统的转移速率,而系统参数的不确定性使得MDP的转移速率往往很难精确得知。针对一类不确定多链MDP模型,基于性能势对参数不相关和相关两种情况下的鲁棒控制问题进行了探讨,并分别给出求解系统最优鲁棒性能的策略迭代和并行遗传算法。最后,通过一个数值例子分析相关算法的有效性。; 周雷唐昊程燕; 关键词：性能势鲁棒控制并行遗传算法

基于带宽和路径跳数的CAC和路由问题的控制策略: 在QoS框架下研究呼叫接入控制和路由问题的控制策略,探讨呼叫接纳准则和路径选择策略,以降低新呼叫拒绝率和提高网络资源的利用率。本文结合可用带宽资源和路径跳数定义一个评价函数,给出了一种基于阈值接纳和概率择路的CAC和Ro...; 周雷唐昊; 关键词：呼叫接入控制路由跳数; 文献传递

CSPS模型基于Q学习的Look-Ahead控制: 探讨基于 Look-Ahead 控制的传送带服务生产加工站（Conveyor-Serviced Production Station,CSPS）的优化控制问题。通过建模为半 Markov 决策过程（SMDP）,基于性能势...; 吴慧唐昊周雷; 关键词：LOOK-AHEAD Q学习; 文献传递

一种MDP基于性能势的并行Q学习算法: 2009年; 在性能势理论框架内,研究折扣和平均准则马尔可夫决策过程(MDP)的统一并行Q学习算法。提出了独立并行Q学习算法和状态划分并行Q学习算法,重点讨论了算法中的关键参数的设计,即同步点如何选择的同步策略和如何合成Q因子的Q值构建策略,给出了一种固定步长结合一定偏移量的同步策略,并分析了并行中Q值构建策略的确定原则,给出了几种Q值构建策略的选择方法。仿真实验表明并行Q学习算法的有效性。; 程文娟唐昊李豹周雷; 关键词：Q学习马尔可夫决策过程性能势

全选清除导出

共1页<1>

执行隐藏清空

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张