|本期目录/Table of Contents|

[1]丁 玲.基于神经网络深度强化学习的分拣机器人避障规划技术[J].工业仪表与自动化装置,2023,(02):46-50.[doi:10.19950/j.cnki.cn61-1121/th.2023.02.009]
 DING Ling.Obstacle avoidance planning technology of sorting robot based on neural network deep reinforcement learning[J].Industrial Instrumentation & Automation,2023,(02):46-50.[doi:10.19950/j.cnki.cn61-1121/th.2023.02.009]
点击复制

基于神经网络深度强化学习的分拣机器人避障规划技术

《工业仪表与自动化装置》[ISSN:1000-0682/CN:61-1121/TH]

卷:
期数:
2023年02期
页码:
46-50
栏目:
出版日期:
2023-04-15

文章信息/Info

Title:
Obstacle avoidance planning technology of sorting robot based on neural network deep reinforcement learning
文章编号:
1000-0682(2023)02-0046-05
作者:
丁 玲
上海东海职业技术学院基础部,上海 200241
Author(s):
DING Ling
Basic Department of Shanghai Donghai Vocational and Technical College, Shanghai 200241, China
关键词:
分拣机器人马尔科夫决策神经网络深度强化学习避障规划
Keywords:
sorting robot Markov decision neural network deeply strengthen learning obstacle avoidance planning
分类号:
TP242.2
DOI:
10.19950/j.cnki.cn61-1121/th.2023.02.009
文献标志码:
A
摘要:
分拣机器人的避障决策过程较为复杂,为提高分拣机器人的工作效果,设计基于神经网络深度强化学习的分拣机器人避障规划技术。首先,在动力学场景中设置障碍物,利用马尔科夫决策过程获取分拣机器人的运动状态后,判断障碍目标。在对神经网络实施深度优化学习后,设置了导引奖赏机制,并结合人工势场法建立连续型奖励函数,引导机器人向正确方向运动。将分拣机器人运动状态输入到神经网络中,在导引奖赏机制的引导下实现分拣机器人的避障。在环境中设置了障碍物,实现环境搭建,仿真测试实验结果表明:该方法具有较高的避障能力,可引导机器人在运动过程中做出正确的动作,进而实现精准避障。
Abstract:
The decision-making process of obstacle avoidance of sorting robot is relatively complex. To improve the working effect of sorting robot, the obstacle avoidance planning technology of sorting robot based on neural network deep reinforcement learning is designed. First of all, obstacles are set in the dynamic scene, and the Markov decision process is used to obtain the movement state of the sorting robot, and then the obstacle target is judged. After the deep optimization learning of the neural network, a guiding reward mechanism is set up, and a continuous reward function is established by combining the artificial potential field method to guide the robot to move in the right direction. The motion state of the sorting robot is input into the neural network, and the obstacle avoidance of the sorting robot is realized under the guidance of the guidance reward mechanism. Obstacles are set in the environment to build the environment. The simulation test results show that the method has a high obstacle avoidance ability, which can guide the robot to make correct actions in the movement process, and then achieve accurate obstacle avoidance..

参考文献/References:

[1]夏晶,张昊,周世宁,等.煤矸分拣机器人动态拣取避障路径规划[J].煤炭学报,2021,46(S1):570-577.

[2]柳振宇,薛毓强,谢祖强.基于闭环和前馈控制的高速食品分拣机器人控制技术[J].食品与机械,2021,37(07):87-93.
[3]董诗绘,牛彩雯,戴琨.基于深度强化学习的变电站巡检机器人自动化控制方法研究[J].高压电器,2021,57(02):172-177.
[4]成怡,郝密密.改进深度强化学习的室内移动机器人路径规划[J].计算机工程与应用,2021,57(21):256-262.
[5]孙立香,孙晓娴,刘成菊,等.人群环境中基于深度强化学习的移动机器人避障算法[J].信息与控制,2022,51(01):107-118.
[6]傅质馨,李潇逸,朱俊澎,等.基于马尔科夫决策过程的家庭能量管理智能优化策略[J].电力自动化设备,2020,40(07):141-152.
[7]李波,牛力,彭紫艺,等.基于马尔科夫决策过程的车载边缘计算切换策略[J].计算机工程与科学,2020,42(05):788-794.
[8]刘青松,陈建平,傅启明,等.一种新的基于函数逼近协同更新的DQN算法[J].计算机科学,2020,47(S1):130-134+147.
[9]谢勇盛,杨余旺,邱修林,等.基于函数逼近的强化学习FANET路由优化算法[J].计算机工程,2021,47(11):207-213.
[10]于建均,李晨,左国玉,等.基于LSTM神经网络的仿人机器人循环步态的生成方法[J].北京工业大学学报,2020,46(12):1335-1344.
[11]熊志金,王春燕.采用RBF神经网络滑模控制的冗余机械臂避障研究[J].中国工程机械学报,2020,18(03):205-209.
[12]常东峰,南新元.基于混合麻雀算法改进反向传播神经网络的短期光伏功率预测[J].现代电力,2022,39(03):287-298.
[13]李伟,金世俊.基于人工势场法和启发式采样的最优路径收敛方法[J].计算机应用,2021,41(10):2912-2918.
[14]罗强,王海宝,崔小劲,等.动态环境下改进人工势场法的仓储机器人自主导航系统研究[J].计算机应用研究,2020,37(03):745-749+762.
[15]曹毅,周轶,张亚宾.基于优化A~*和DWA算法的移动机器人避障路径规划(英文)[J].机床与液压,2020,48(24):246-252.
[16]欧阳勇平,魏长赟,蔡帛良.动态环境下分布式异构多机器人避障方法研究[J].智能系统学报,2022,17(04):752-763.

相似文献/References:

备注/Memo

备注/Memo:
收稿日期:2022-12-08
基金项目:
上海市教育委员会上海市民办教育发展基金会2020年“民智计划”—“民办高职院校在线教学课程质量评价体系构建”
第一作者:
丁玲(1982—),女,江苏泰兴人,硕士,讲师,研究方向为计算机软件应用及设计。
更新日期/Last Update: 1900-01-01