学位专题

<

基于迭代学习算法的六自由度机械臂运动学求解分析

周锋
中国科学技术大学
引用
机械臂是机器人执行操作任务的重要部分,但不同公司的机械臂结构多种多样,分别有不同的控制方程式,没有统一的控制方法。上世纪90年代,神经网络被用在机械臂逆运动学的求解上,位姿作为神经网络的输入,关节角作为神经网络的输出,研究的对象从二关节、三关节到现在主流应用的六关节机械臂,神经网络的输入、输出也不断变化,输入可以是目标位姿、当前位姿和目标位姿与当前位姿之差、相机获取的  目标物体图像,输出可以是关节角、目标关节角和当前关节角之差、电机的力矩,但缺点很明显,神经网络只能输出一个解,而到达目标位姿、抓取物体有多个解,且使用神经网络模拟这种非函数关系的效果受训练数据影响较大。  Sergey Levine等将相机图像和电机命令作为神经网络输入,抓取成功的概率作为神经网络的输出。对于一个确定的输入,输出是确定的、唯一的,这种输入、输出发挥了神经网络模拟函数关系的优势。但其在寻解时,是随机一批电机命令输入神经网络获得抓取成功概率,而后使用CEM算法获得抓取成功率最高的电机命令,没有充分发挥神经网络反向传播求电机命令导数并像优化神经网络权值一样优化电机命令的优势,且需要预训练大量的训练数据,不具有热启动特性。  本文提出拥有记忆单元的迭代学习算法,该算法以目标位姿为驱动,通过神经网络反向传播求目标位姿与当前位姿之差的平方和对当前关节角的导数,并通过梯度下降、线性搜索算法寻找最优关节角,执行电机命令至寻找到的关节角并获得真实位姿,如果满足误差要求,则结束,如果不满足要求,则将刚才实践的数据加入记忆单元并训练神经网络,继续寻找关节角。通过优化关节角和优化网络权值这两种无缝衔接的循环的优化过程,达到迭代学习和热启动的目的;通过使用有限的记忆单元,使神经网络使用更少的数据达到收敛,且不必记忆大量的训练数据;对不同误差要求的任务,使用本文所提方法训练的神经网络具有更强的适应性。  对于神经网络认为不可达的位姿,本文提出试探性学习策略算法,在不限制尝试次数的情况下,可以100%完成任意精度的任意目标位姿。  本文所提算法是对神经网络模拟的函数关系的反向应用。通过构建良性循环生态,让神经网络自己去学习。该算法具有普遍适用性。

机械臂;逆运动学;神经网络;迭代学习

中国科学技术大学

硕士

计算机系统结构

陈小平

2017

中文

TP241

100

2018-05-30(万方平台首次上网日期,不代表论文的发表时间)

相关文献
评论
相关作者
相关机构
打开万方数据APP,体验更流畅