您的位置: 专家智库 > >

唐波

作品数:2 被引量:1H指数:1
供职机构:中国科学技术大学信息科学技术学院自动化系更多>>
发文基金:国家自然科学基金国家高技术研究发展计划中国科学技术大学青年基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇一致最终有界
  • 1篇有界
  • 1篇误差分析
  • 1篇误差界
  • 1篇线性系
  • 1篇非线性
  • 1篇非线性系统
  • 1篇差分

机构

  • 2篇中国科学技术...

作者

  • 2篇殷保群
  • 2篇唐波
  • 1篇金辉宇
  • 1篇李衍杰

传媒

  • 1篇中国科学技术...
  • 1篇控制理论与应...

年份

  • 1篇2009
  • 1篇2008
2 条 记 录,以下是 1-2
排序方式:
连续时间部分可观Markov决策过程的策略梯度估计被引量:1
2009年
针对连续时间部分可观Markov决策过程(CTPOMDP)的优化问题,本文提出一种策略梯度估计方法.运用一致化方法,将离散时间部分可观Markov决策过程(DTPOMDP)的梯度估计算法推广到连续时间模型,研究了算法的收敛性和误差估计问题,并用一个数值例子来说明该算法的应用.
唐波李衍杰殷保群
关键词:误差界
非线性采样观测器的误差分析
2008年
通过分析非线性系统采样观测器的误差,给出了观测器误差一致最终有界的条件,估算了误差的最终边界.分析结果表明,采样周期固定时,选择精度更高的数值方法可以减小观测器的误差.
金辉宇殷保群唐波
关键词:非线性系统一致最终有界
共1页<1>
聚类工具0