国家教育部博士点基金(20101103110007) 作品数:26 被引量:103 H指数:6 相关作者: 阮晓钢 于建均 魏若岩 黄静 庞涛 更多>> 相关机构: 北京工业大学 麦吉尔大学 沈阳航空航天大学 更多>> 发文基金: 国家教育部博士点基金 国家自然科学基金 国家重点基础研究发展计划 更多>> 相关领域: 自动化与计算机技术 哲学宗教 航空宇航科学技术 更多>>
基于AOCA仿生学习模型的两轮机器人自主平衡学习研究 被引量:3 2014年 以两轮机器人的自主平衡学习控制为研究对象,针对传统控制方法无法实现机器人类似人或动物的渐进学习过程,依据斯金纳的操作条件反射理论建立了一种自治操作条件反射自动机(Autonomous operant conditioning automaton,AOCA)模型,设计一种基于AOCA的仿生学习算法,并进行机器人姿态平衡学习实验仿真研究.实验结果表明,基于AOCA的仿生学习方法能有效地实现机器人的自主平衡学习控制,机器人系统的平衡能力在学习控制过程中自组织地渐进形成,并得以发展和完善. 戴丽珍 杨刚 阮晓钢关键词:两轮机器人 仿生学 操作条件反射 自学习 基于高斯过程的机器人模仿学习研究与实现 被引量:2 2015年 针对机器人模仿学习控制策略获取的问题,基于高斯过程的方法,建立示教机器人示教行为的样本数据的高斯过程回归模型并加以训练,以求解示教机器人的感知和行为之间的映射关系,并将此映射关系作为模仿机器人的控制策略来实现对示教行为的模仿.以Braitenberg车为仿真对象,研究趋光模仿学习行为.仿真实验表明:基于高斯过程的机器人模仿学习算法具有有效性,模仿机器人在不同任务环境下具有很好的适应性. 于建均 韩春晓 阮晓钢 刘涛关键词:机器人 模仿学习 高斯过程 独轮机器人的建模与自抗扰控制算法 被引量:12 2015年 独轮机器人前后平衡由一车轮保持并驱动其前后运动,侧向平衡则由一基于空气阻力的风轮保持,以此结构为被控对象建立该系统动力学模型.以一种非线性的控制方法—–自抗扰控制方法控制其平衡运动,在系统的纵向和侧向上分别设计一个自抗扰控制器,系统的内扰和外扰被视为自抗扰控制器的总扰动.以PID控制方法作对比实验,仿真结果表明了自抗扰控制算法的强鲁棒性和有效性. 阮晓钢 王旭 陈志刚关键词:动力学模型 自抗扰控制 鲁棒性 基于Skinner操作条件反射的抽样一致性算法 被引量:3 2015年 针对基础矩阵的估计问题,提出一种基于Skinner概率自动机的抽样一致性算法(Skinner-Ransac).该算法对数据样本集合中的每个样本赋予权值,并根据当前的抽样结果对每一个样本的权值进行更新;同时,针对先验知识缺乏的情况提出了3种迭代终止条件.以一组模拟数据和一组真实图像作为实验对象,与4个现有算法进行对比的实验结果表明,Skinner-Ransac无论在迭代次数,还是在计算精度上均优于其他算法. 魏若岩 阮晓钢 于乃功 黄静 朱晓庆 肖尧关键词:认知心理学 小天体软着陆中的地面特征区域提取与跟踪算法 被引量:1 2014年 考虑到自主导航过程中的特征区域检测与跟踪问题,提出了一种新的跟踪算法。该算法是基于DIMES框架。首先,对在软着陆过程中拍摄的行星表面图像进行亮度均衡化,对处理后的图像进行二值化;然后,对二值化特征区域进行模板匹配找出高度相关位置点;最后,根据特征区域之间的几何关系确定特征区域的搜索范围,再分别提取这些相关点所代表区域的特征向量,并且与模板的特征向量进行相似性分析从而找到相似性最大的位置点。通过两组小行星表面图片进行分析验证得到了较好的效果。 魏若岩 阮晓钢 庞涛 Ouattara SIE 武旋 肖尧关键词:软着陆 图像相关 特征向量 一种基于操作条件反射原理的学习模型 被引量:4 2014年 针对认知机器人的自主学习问题,提出一种基于操作条件反射原理的学习模型(OCLM).该模型采用状态空间、操作行为空间、概率分布函数、仿生学习机制、系统熵等进行描述,给出状态的"负理想度"的概念,定义了取向函数的计算方法.运用模型对机器人避障导航问题进行仿真实验,并对参数设置进行了讨论.实验结果表明,基于OCLM模型的机器人能通过与环境的交互获得认知,成功避障到达目的地,具有一定的自学习能力,从而表明了模型的有效性. 阮晓钢 黄静 范青武 魏若岩关键词:操作条件反射 自学习 仿生 避障 基于RNN的机械臂任务模仿系统 被引量:3 2018年 为了简化机械臂复杂的运动规划问题,且使机械臂具有适应新任务的泛化能力,研究并实现了一种基于循环神经网络(recurrent neural network,RNN)的机械臂任务模仿系统.首先,由示教者进行原始任务示教并采集示教数据;其次,通过构建RNN对原始示教数据进行训练,得到机械臂对示教任务模仿的控制策略;然后,当任务发生变化时,观察新任务的运动并采集运动信息;最后,通过基于RNN的控制策略对新任务运动信息进行泛化输出,得到机械臂模仿新任务的控制信息,进而完成模仿.物理对象实验结果表明,系统具有简单高效的策略获取能力以及良好的泛化能力,使机械臂不仅能够模仿原始示教任务,而且可以通过泛化实现对新任务的模仿. 于建均 吴鹏申 左国玉 阮晓钢 张远关键词:控制策略 机械臂 泛化 基于质心校正补偿的仿人机器人模仿学习 被引量:1 2018年 由于仿人机器人自由度多、结构冗余,因此面对不同环境下的运动规划十分复杂.利用人体运动信息作为示教数据,实现仿人机器人对人体姿态的模仿学习,简化了仿人机器人的运动规划.为满足机器人在运动过程中的平衡性,提出了一种机器人质心补偿的方法:通过示教数据预估机器人的质心偏移,经质心-角度雅可比矩阵计算角度补偿量,并引入二次规划进行优化处理.基于Nao机器人的模仿学习系统实验研究结果表明:提出的质心补偿方法可以有效地保证机器人在模仿学习过程中的姿态平衡,引入的权值可调的二次规划有效地保证了姿态模仿的相似性. 于建均 张远 左国玉 阮晓钢 吴鹏申关键词:仿人机器人 模仿学习 雅可比矩阵 The skinner automaton: A psychological model formalizing the theory of operant conditioning 被引量:8 2013年 Operant conditioning is one of the fundamental mechanisms of animal learning, which suggests that the behavior of all animals, from protists to humans, is guided by its consequences. We present a new stochastic learning automaton called a Skinner au- tomaton that is a psychological model for formalizing the theory of operant conditioning. We identify animal operant learning with a thermodynamic process, and derive a so-called Skinner algorithm from Monte Carlo method as well as Metropolis algo- rithm and simulated annealing. Under certain conditions, we prove that the Skinner automaton is expedient, 6-optimal, optimal, and that the operant probabilities converge to the set of stable roots with probability of 1. The Skinner automaton enables ma- chines to autonomously learn in an animal-like way. RUAN XiaoGang WU Xuan基于BP网络的机器人感觉运动系统研究 2012年 生物的诸多技能是在生物个体的生长发育过程中逐渐形成和发展起来的,能否赋予机器人这样一种特性呢?为此,本文基于BP神经网络为机器人建立起一种类似生物的感觉运动系统,使机器人与外界环境之间交互作用,产生自主负趋光行为。实验结果表明机器人在建立的基于BP神经网络的人工感觉运动系统中,能够通过多次的学习,实现自主负趋光行为,并且产生的行为与由生物所产生的行为一致。 戴丽珍 阮晓钢 于乃功关键词:机器人 BP神经网络