海南省自然科学基金(613153)
- 作品数:4 被引量:12H指数:2
- 相关作者:张春元林志阳朱清新王磊王兆晖更多>>
- 相关机构:海南大学电子科技大学西南科技大学更多>>
- 发文基金:海南省自然科学基金国家自然科学基金四川循环经济研究中心资助项目更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于对称扰动采样的Actor-critic算法被引量:1
- 2015年
- 针对传统Actor-critic(AC)方法在求解连续空间序贯决策问题时收敛速度较慢、收敛质量不高的问题,提出一种基于对称扰动采样的AC算法框架.首先,框架采用高斯分布作为策略分布,在每一时间步对当前动作均值对称扰动,从而生成两个动作与环境并行交互;然后,基于两者的最大时域差分(TD)误差选取Agent的行为动作,并对值函数参数进行更新;最后,基于两者的平均常规梯度或增量自然梯度对策略参数进行更新.理论分析和仿真结果表明,所提框架具有较好的收敛性和计算效率.
- 张春元朱清新
- 连续空间增量最近邻时域差分学习被引量:2
- 2014年
- 针对连续空间强化学习问题,提出一种基于局部加权学习的增量最近邻时域差分(TD)学习框架.通过增量方式在线选取部分已观测状态构建实例词典,采用新观测状态的范围最近邻实例逼近其值函数与策略,并结合TD算法对词典中各实例的值函数和资格迹迭代更新.就框架各主要组成部分给出多种设计方案,并对其收敛性进行理论分析.对24种方案组合进行仿真验证的实验结果表明,SNDN组合具有较好的学习性能和计算效率.
- 张春元朱清新钟声
- 基于小波分析的盲源分离被引量:1
- 2013年
- 提出一种新盲源(BSS)分离算法是在独立分量分析(ICA)算法中引入离散小波变换技术分解出有用信号.ICA是一种线性非高斯统计方法,不仅能够使研究对象相互独立或尽可能独立,而且能突出源信号的本质结构.笔者采用的新盲源算法能够将时-频ICA相结合,实现了较好的盲源分离.
- 林志阳白洋张春元易家傅
- 关键词:盲源分离离散小波变换独立分量分析
- 一种减小OFDM系统PAPR的算法分析被引量:9
- 2014年
- 传统的部分传输序列(PTS)算法可以降低正交频分复用(OFDM)系统的高峰值平均功率比(PAPR),但自身较为复杂难以直接应用到OFDM系统中。为了有效降低OFDM系统PAPR,在粒子群总数增加时减少迭代次数,增加系统的稳定性,提出了一种基于PSO-PTS联合算法。通过对粒子群参数进行优化与仿真分析,结果表明,提出的PSO-PTS混合算法能有效的减小OFDM系统的PAPR,也降低了计算复杂度。
- 林志阳王磊王兆晖张春元周又玲丁洁张莉
- 关键词:正交频分复用峰均功率比粒子群算法