基于上下文感知的強化學習AUV控制器研究
艦船科學技術
頁數(shù): 7 2024-06-08
摘要: 為了提升基于強化學習的自主水下航行器(Autonomous Underwater vehicle,AUV)控制器在復雜海況中對環(huán)境干擾的魯棒性,設計一種利用上下文信息進行環(huán)境感知的強化學習控制器。結合水下機器人運動學及動力學方程對深度跟蹤任務進行建模,構建了基于PPO-clip算法的深度控制器,并在算法中融入了上下文變量和域隨機化方法。在仿真環(huán)境中分別進行海流干擾、暗涌干擾以及... (共7頁)