基于深度强化学习的柑橘采摘机械臂路径规划方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于深度强化学习的柑橘采摘机械臂路径规划方法

作者姓名：	熊春源熊俊涛杨振刚胡文馨

作者单位：	华南农业大学数学与信息学院, 广东广州 510642

基金项目：	国家自然科学基金(32071912);广州市基础研究计划(202102080337)

摘要：	【目的】为解决非结构化环境下采用深度强化学习进行采摘机械臂路径规划时存在的效率低、采摘路径规划成功率不佳的问题,提出了一种非结构化环境下基于深度强化学习(Deep reinforcement learning, DRL)和人工势场的柑橘采摘机械臂的路径规划方法。【方法】首先,通过强化学习方法进行采摘路径规划问题求解,设计了结合人工势场的强化学习方法;其次,引入长短期记忆(Longshort term memory,LSTM)结构对2种DRL算法的Actor网络和Critic网络进行改进;最后,在3种不同的非结构化柑橘果树环境训练DRL算法对采摘机械臂进行路径规划。【结果】仿真对比试验表明：结合人工势场的强化学习方法有效提高了采摘机械臂路径规划的成功率;引入LSTM结构的方法可使深度确定性策略梯度(Deep deterministic policy gradient,DDPG)算法的收敛速度提升57.25%,路径规划成功率提升23.00%;使软行为评判(Soft actor critic,SAC)算法的收敛速度提升53.73%,路径规划成功率提升9.00%;与传统算法RRT-connec...
关键词：	采摘机械臂柑橘路径规划深度强化学习非结构化环境 LSTM
收稿时间：	2022-06-17

	点击此处可从《华南农业大学学报》浏览原始摘要信息
	点击此处可从《华南农业大学学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏