搜索到133篇“ 模糊Q学习“的相关文章
一种新型电力变压器故障模糊Q学习推理方法
本发明公开了一种新型电力变压器故障模糊Q学习推理方法,包括:建立电力变压器故障Q学习形式方程;根据环境状态s选择动作a,并观察瞬时奖赏r和新状态s,将Q学习形式方程进行更新;定义模糊推理系统规则库;假设模糊推理系统规则库...
朱雪松农正军冯海斌许义山杨小锋陈敬瑞林师严关洪亮刘彩利王亚四黄良泉蔡德帅杨沛豪薛菲梁舒婷李泽才赵俊博燕云飞孙梦瑶李志鹏
基于模糊Q学习的孤岛微电网储能优化
风能和太阳能等清洁绿色的可再生能源出现,可以有效缓解人们对化石能源的依赖,同时也可以有效解决一些可再生能源丰富偏远地区的供电需求。但是由于太阳能和风能的随机性和波动性,需要对含有可再生能源的微电网进行优化控制,以保证其稳...
秦洋
关键词:能量管理模糊Q学习
基于模糊Q学习的自能源综合能量管理策略被引量:1
2019年
随着用户在综合能源系统中的参与度以及系统复杂度的提升,传统的能源枢纽已无法完全满足需求。同时,如何解决环境与负荷的不确定性以及提升能量单元的自我调节能力是亟需考虑的因素。基于此,提出了具备全双工与分布式特性的自能源单元,构建了一种针对多种不确定性以及需求侧响应的自能源综合调度模型并提出相应的能量管理策略。相较于其他模型,所提自能源综合调度模型全面描述了自能源在能源互联网中的运行特点。进一步,采用对环境模型需求较低的增强学习算法,引入不确定性作为状态指标并进行模糊离散化处理,使其可以在无前期预测的情况下解决模型中的多种不确定性带来的影响。仿真结果证明,所提综合能量管理策略具有较高的效率和更好的适用性,能有效实现不确定环境下自能源的最优调配。
张宁孙秋野马大中
关键词:能量管理需求侧响应不确定性
一种基于模糊Q学习的六足机器人避障方法
本发明提供了一种基于模糊Q学习的六足机器人避障方法,步骤包括:由六足机器人通过前部的超声波传感器测量机器人周围的障碍物距离,并通过模糊推理将测量的障碍物距离转化为有限的状态集合;根据有限的状态集合在仿真平台中进行避障仿真...
陈春林唐开强洪俊王岚吴涛于跃文陈文玉朱张青辛博刘力锋王子辉
文献传递
基于模糊Q学习的分布式自适应交通信号控制被引量:3
2013年
针对当前城市区域交通状况复杂,难以用传统数学模型对其进行精确描述的特点,提出了一种基于模糊Q学习的分布式交通协调控制模型。该模型将每一个路口的交通控制系统看作一个独立的路口Agent,每一个路口Agent根据预测的当前相位和下一相位的交通流信息以及下游路段的交通流信息采用模糊Q学习算法决策出当前相位的绿灯时间,最后利用VISSIM4.2交通仿真平台进行了简单网络仿真实验,验证了该算法的可行性。仿真结果表明,该模型运用于交通控制中相比于定时控制能有效提高路网控制效率。
聂建强徐大林
关键词:交通状态模糊控制Q学习
一种基于模糊Q学习算法的认知无线电频谱分配策略被引量:1
2013年
认知无线电是一种智能推理学习的通信系统,为了实现认知无线电频谱分配智能学习过程,引入模糊Q学习方法。认知用户通过在线Q学习来调节模糊推理系统,得到最优的频谱分配模糊规则,实现自适应的频谱分配方案。最后将模糊Q频谱分配算法与非智能学习算法(模糊频谱分配算法以及随机分配算法)进行比较,仿真结果证明了该方案能在一定程度上提高系统带宽收益,同时降低系统的冲突率。
徐勇果鑫刘丰年文鸿张文平李长云
关键词:认知无线电自适应频谱分配
城市区域交通信号的混沌模糊Q学习控制被引量:2
2012年
提出了一种解决城市区域交通协调控制问题的混沌模糊Q学习(C-FQL)方法。在模糊Q学习的过程中添加混沌扰动,以改进传统的Agent选择动作的方式,并通过遗忘因子以平衡模糊Q学习中探索和利用之间的关系。将该算法应用于城市区域交通协调控制中优化各信号交叉口的周期、绿信比和相位差。利用TSIS交通仿真平台,建立典型的城市区域交通网络并进行仿真。仿真结果表明该方法可以大大提高区域交通的整体效率。
刘智勇宋正东
关键词:区域交通控制Q学习模糊控制
基于模糊Q学习算法的AGV路径规划研究被引量:7
2012年
路径规划是AGV控制系统中的关键技术。文章在分析了AGV路径规划方法的基础上,对于未知环境下AGV的局部路径规划问题,设计了一种改进的模糊Q学习路径规划策略,并给出具体执行步骤,最后用Matlab进行了仿真。仿真结果表明该方法规划的轨迹平滑、实时性好、具有良好的效果,该研究为进一步控制AGV奠定了基础。
陈自立徐娅萍顾立彬
关键词:AGV未知环境模糊Q学习路径规划
智能办公环境中多Agent模糊Q学习研究被引量:1
2012年
目前有关智能办公环境的研究忽视了对建筑环境的考虑,为了给工作人员提供一个节能、舒适、便捷的办公环境,研究了智能办公环境无线网络系统的学习方法,即为系统建立了多智能体(Agent)模型,基于该模型提出了改进的模糊Q学习算法,用于学习用户的行为,以自动控制环境中执行器的动作。通过对环境温度学习的实验,比较了该算法和普通Q学习的MSE(Mean Square Error)值,实验结果表明提出的算法较优。
王海珍廉佐政滕艳平
关键词:自动控制环境温度
模糊Q学习的足球机器人双层协作模型被引量:4
2008年
针对传统的足球机器人3层决策模型存在决策不连贯的问题和缺乏适应性与学习能力的缺点,提出了一种基于模糊Q学习的足球机器人双层协作模型.该模型使协调决策和机器人运动成为2个功能独立的层次,使群体意图到个体行为的过度变为一个直接的过程,并在协调层通过采用Q学习算法在线学习不同状态下的最优策略,增强了决策系统的适应性和学习能力.在Q学习中通过把状态繁多的系统状态映射为为数不多的模糊状态,大大减少了状态空间的大小,避免了传统Q学习在状态空间和动作空间较大的情况下收敛速度慢,甚至不能收敛的缺点,提高了Q学习算法的收敛速度.最后,通过在足球机器人SimuroSot仿真比赛平台上进行实验,验证了双层协作模型的有效性.
曹卫华徐凌云吴敏
关键词:足球机器人Q学习

相关作者

文孟飞
作品数:14被引量:85H指数:7
供职机构:中南大学信息科学与工程学院
研究主题:智能代理 大数据 多模态 卷积神经网络 目标识别
李利民
作品数:8被引量:1H指数:1
供职机构:哈尔滨工业大学
研究主题:参考点 WLAN 信号强度 指纹数据库 移动计算
滕艳平
作品数:58被引量:179H指数:7
供职机构:齐齐哈尔大学
研究主题:拥塞控制 嵌入式LINUX 操作系统 TCP 嵌入式
马大中
作品数:42被引量:351H指数:9
供职机构:东北大学信息科学与工程学院
研究主题:能源互联网 数据驱动 线性矩阵不等式 多时间尺度 微网
郭四稳
作品数:43被引量:183H指数:7
供职机构:广州大学
研究主题:网络工程 几何信息 组件 实践教学 实验室