徐琰恺
- 作品数:5 被引量:4H指数:1
- 供职机构:清华大学信息科学技术学院智能与网络化系统研究中心更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于全内反射原理的足底压力分布检测装置
- 本发明涉及一种基于全内反射原理的足底压力分布检测装置,包括透明薄膜、透明刚性平板、成像系统、光接收器和图像处理系统。透明薄膜置于透明刚性平板之上,成像透镜置于透明刚性平板下方,在透镜下方的光接收器接收通过透镜所成的图像,...
- 王人成姜明文金德闻刘勇徐琰恺
- 文献传递
- 模态跳变概率可控的Markov跳变线性系统的优化被引量:3
- 2008年
- 研究模态跳变概率可控的Markov跳变线性二次模型的最优控制问题.考虑两类模态跳变控制策略:开环模态控制和闭环模态控制,应用策略迭代和性能势的概念,给出了最优的闭环模态控制优于最优的开环模态控制的充分条件,以指导最优控制器的设计.在已知最优的开环模态控制策略的基础上,应用策略迭代给出了构造闭环模态控制策略的方法,以进一步改善系统的性能.
- 徐琰恺陈曦
- 关键词:MARKOV跳变系统最优控制策略迭代
- 基于全内反射原理的足底压力分布检测装置
- 本发明涉及一种基于全内反射原理的足底压力分布检测装置,包括透明薄膜、透明刚性平板、成像系统、光接收器和图像处理系统。透明薄膜置于透明刚性平板之上,成像透镜置于透明刚性平板下方,在透镜下方的光接收器接收通过透镜所成的图像,...
- 王人成姜明文金德闻刘勇徐琰恺
- 基于强化学习的JLQ模型的直接自适应最优控制被引量:1
- 2008年
- 研究离散时间跳变线性二次(JLQ)模型的直接自适应最优控制问题.将强化学习的理论和方法应用于JLQ模型,设计基于Q函数的策略迭代算法,以优化系统性能.在系统参数以及模态跳变概率未知的情况下,Q函数对应的参数矩阵,可通过观察给定策略下系统行为,应用递归最小二乘算法在线估计.基于此参数矩阵,可构造出新的策略使得系统性能更优.该算法可收敛到最优策略.
- 徐琰恺陈曦
- 关键词:策略迭代
- 控制系统的学习和优化:马尔可夫性能势理论与方法
- 本文采用性能势理论和方法,研究了动态控制系统的学习和优化的问题。性能势理论是学习和优化领域相当重要的一套理论和方法。基于性能势这一核心概念,可以将学习和优化领域的各种研究内容和成果放到统一的框架中。进一步,还可以提出相当...
- 徐琰恺
- 关键词:离散事件动态系统马尔可夫决策过程性能势最优控制
- 文献传递