您的位置: 专家智库 > >

国家教育部博士点基金(20130111110007)

作品数:12 被引量:26H指数:3
相关作者:唐昊谭琦周雷江琦程文娟更多>>
相关机构:合肥工业大学安徽财贸学院安徽财贸职业学院更多>>
发文基金:国家教育部博士点基金国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
相关领域:自动化与计算机技术电气工程理学自然科学总论更多>>

文献类型

  • 12篇期刊文章
  • 2篇会议论文

领域

  • 10篇自动化与计算...
  • 2篇理学
  • 1篇电气工程
  • 1篇自然科学总论

主题

  • 4篇马尔可夫决策...
  • 4篇Q学习
  • 3篇站点
  • 3篇半马尔可夫决...
  • 2篇电网
  • 2篇多AGENT...
  • 2篇优化控制
  • 2篇前视
  • 2篇工件
  • 2篇复杂系统
  • 2篇半MARKO...
  • 2篇储能
  • 1篇单机
  • 1篇多路
  • 1篇多路径
  • 1篇多路径路由
  • 1篇多路径路由协...
  • 1篇多品种
  • 1篇信息交互
  • 1篇需求响应

机构

  • 12篇合肥工业大学
  • 1篇安徽财贸职业...
  • 1篇安徽财贸学院

作者

  • 12篇唐昊
  • 6篇谭琦
  • 5篇周雷
  • 2篇程文娟
  • 2篇陆慧
  • 2篇江琦
  • 1篇韩江洪
  • 1篇张晓艳
  • 1篇裴荣
  • 1篇苗刚中
  • 1篇马学森
  • 1篇黄浩
  • 1篇高雪莹
  • 1篇吴松
  • 1篇乔阳
  • 1篇吕凯
  • 1篇李博川
  • 1篇平兆武
  • 1篇周康
  • 1篇许玲玲

传媒

  • 2篇系统仿真学报
  • 2篇控制与决策
  • 1篇佳木斯大学学...
  • 1篇自动化学报
  • 1篇合肥工业大学...
  • 1篇计算机学报
  • 1篇电力系统自动...
  • 1篇控制理论与应...
  • 1篇计算机应用
  • 1篇重庆科技学院...

年份

  • 1篇2019
  • 2篇2017
  • 5篇2016
  • 4篇2015
  • 2篇2014
12 条 记 录,以下是 1-10
排序方式:
基于灰色关联分析方法的复杂系统隐性关联预测模型
2016年
基于复杂系统运行状况构建预测模型的隐性因素集,确立影响因素和指标的灰色经典域和节域;通过对不同类型指标进行规范化处理以及相应的权重生成,建立预测对象与不同经典域之间的灰色关联系数模型与对应的灰色优度计算模型,实现复杂系统的隐性关联关系的单级灰色预测;在单级预测结果的基础上,通过进行隐性因素集和指标的细分,进而实现隐性关联关系的多级灰色预测,从而获得预期的预测结果.通过具体的实例分析对模型进行了说明和验证,分析结果表明,该模型具有操作可行性和有效性.
陆慧
关键词:灰色关联分析灰色预测复杂系统
基于RBF-Q学习的多品种CSPS系统前视距离控制被引量:1
2019年
研究一类多品种工件到达的传送带给料加工站系统(CSPS)的前视距离(Look-ahead)优化控制问题,以提高系统的工作效率。在工件品种数增加的情况下,系统状态规模会呈现指数性增长,考虑传统Q学习在面对大规模离散状态空间所面临的维数灾难,且难以直接处理前视距离为连续化变量的问题,引入了RBF网络来逼近Q值函数,网络的输入为状态行动对,输出为该状态行动对的Q值。给出RBF-Q学习算法,并应用于多品种CSPS系统的优化控制中,实现了连续行动空间的Q学习。针对不同的品种数情况进行仿真分析,仿真结果表明, RBF-Q学习算法可以对多品种CSPS系统性能进行有效优化,并且提高学习速度。
唐昊杨羊戴飞谭琦
关键词:RBF网络Q学习
传送带给料分批加工系统在线优化控制方法被引量:1
2017年
传送带给料分批加工系统中,工件动态到达,并配置有存放待加工工件的缓冲区,其加工主体为批处理设备。考虑工件属性差异,重点研究单机模型的在线优化控制问题。以前视距离为控制变量,无穷时段内的工件处理率最大为优化目标,建立了系统的优化模型。针对该模型中的工件分批决策,提出一种以批处理机加工周期内加工能力浪费比最小为准则的工件分批规则。对于该模型中的行动选择决策,文中引入Q学习优化算法,以求解最优前视控制策略。通过仿真实验,对算法的有效性进行了验证,并分析了不同分批策略及参数对系统性能的影响。
吴松唐昊谭琦
关键词:批处理差异工件单机
基于SMDP的光柴储独立微网能量控制策略优化被引量:4
2016年
考虑含光伏发电装置、储能装置和柴油发电机组的独立微网系统,以提高微网长期运行经济性为目标,研究微网能量管理优化问题。首先对系统的随机动态特性进行建模,即针对光伏发电和负荷变化的随机特性,将微网系统的能量控制建模为半马尔可夫决策过程(SMDP);然后采用随机动态规划算法对最优策略进行求解,得到微网在不同的光伏发电功率、负荷需求、储能荷电状态等级和柴油发电机组运行数量下对柴油发电机组和储能装置的最优控制行动。仿真结果说明了所建随机模型的合理性和优化方法的有效性。
周康唐昊江琦吕凯蒋兰海
关键词:光伏发电储能半马尔可夫决策过程
一种基于多Agent强化学习的无线传感器网络多路径路由协议被引量:7
2016年
文章研究了无线传感器网络中存在的多条最短路径路由选择问题。将无线传感器网络看作多Agent系统,采用强化学习理论,提出了一种基于多Agent强化学习的无线传感器网络多路径路由协议MRLMPRP(Multi-agent Reinforcement Learning based Multiple-path Routing Protocol)。该协议综合考虑了所要发送数据的优先级、节点间的链路质量以及节点数据缓冲队列的拥堵情况,为不同优先级的数据选择出当前网络状况下最优的路径进行数据的传输。仿真结果表明了该协议在降低网络平均端—端延时、提升数据包成功投递率方面的有效性。
乔阳唐昊程文娟江琦马学森
关键词:无线传感器网络多路径路由协议多AGENT系统
多因素作用下复杂系统多级可拓关联预测模型及应用
2016年
针对复杂系统预测分析的问题,提出一种多因素作用下的复杂系统多级可拓关联预测模型。首先建立预测对象的关联指标以及可拓类别,确立不同可拓类别下关联指标的经典域与节域,然后对关联指标进行统一化处理;建立关联预测的可拓关联函数和关联度模型,基于关联度的大小获得预测对象的归属类别。针对单次可拓关联预测结果不理想问题,通过多级细分可拓类别,最终获得精确度较高的预测结果。
陆慧
关键词:复杂系统可拓理论
两类品种工件混流的多站点CSPS系统优化控制被引量:2
2017年
研究一种两类品种工件混流的多站点传送带给料加工站系统的优化控制问题.系统中的站点如何协同工作完成工件加工任务,是提高系统生产率的重要课题.将前视距离作为各站点的决策变量,通过站点间的局部信息交互,提出一种品种均衡工作模式,并运用一种模型无关的串行反馈式多agent强化学习算法求解系统的最优策略.实验结果验证了该工作模式的合理性和算法的有效性,并分析了部分参数变化对系统性能的影响.
唐昊李博川王彬谭琦
关键词:多AGENT强化学习
基于连续时间半马尔可夫决策过程的Option算法被引量:2
2014年
针对大规模或复杂的随机动态规划系统,可利用其分层结构特点或引入分层控制方式,借助分层强化学习(Hierarchical Reinforcement Learning,HRL)来解决其"维数灾"和"建模难"问题.HRL归属于样本数据驱动优化方法,通过空间/时间抽象机制,可有效加速策略学习过程.其中,Option方法可将系统目标任务分解成多个子目标任务来学习和执行,层次化结构清晰,是具有代表性的HRL方法之一.传统的Option算法主要是建立在离散时间半马尔可夫决策过程(Semi-Markov Decision Processes,SMDP)和折扣性能准则基础上,无法直接用于解决连续时间无穷任务问题.因此本文在连续时间SMDP框架及其性能势理论下,结合现有的Option算法思想,运用连续时间SMDP的相关学习公式,建立一种适用于平均或折扣性能准则的连续时间统一Option分层强化学习模型,并给出相应的在线学习优化算法.最后通过机器人垃圾收集系统为仿真实例,说明了这种HRL算法在解决连续时间无穷任务优化控制问题方面的有效性,同时也说明其与连续时间模拟退火Q学习相比,具有节约存储空间、优化精度高和优化速度快的优势.
唐昊张晓艳韩江洪周雷
关键词:分层强化学习Q学习
可变服务率模式下基于需求驱动的传送带给料加工站系统的优化控制被引量:2
2015年
本文主要研究可变服务率模式下基于需求驱动的传送带给料加工站(CSPS)系统的优化控制问题,主要目标是对系统的随机优化控制问题进行建模和提供解决方案.论文以缓冲库和成品库剩余容量为联合状态,以站点前视距离和工件服务率为控制变量,将其最优控制问题描述为半马尔科夫决策过程(SMDP)模型.该模型为利用策略迭代等方法求解系统在平均准则或折扣准则下的最优控制策略提供了理论基础,特别地,据此可引入基于模拟退火思想的Q学习算法等优化方法来寻求近似解,以克服理论求解过程中的维数灾和建模难等困难.仿真结果说明了本文建立的数学模型及给出的优化方法的有效性.
唐昊许玲玲周雷谭琦
关键词:Q学习
储能系统能量调度与需求响应联合优化控制被引量:7
2016年
为了增加含有储能单元及智能用电设备的用户的长期收益,研究了储能系统能量调度及需求响应联合优化问题,对储能单元动作(充电,放电,闲置)及可延时负荷动作(接入,不接入)进行优化控制。建立包括用电经济性及满意度的优化目标函数,根据太阳能光伏发电、负载用电需求以及电网电价的随机特性,将该联合优化问题建模为无穷时段马尔可夫决策过程模型,进而引入Q学习算法对优化问题进行求解。仿真结果表明联合优化控制比单独对电池动作控制或者需求响应控制使用户获得了更高的长期收益。
高雪莹唐昊苗刚中平兆武
关键词:智能电网需求响应马尔可夫决策过程
共2页<12>
聚类工具0