(12)发明专利申请
(21)申请号 CN201911101117.8 (22)申请日 2019.11.12 (71)申请人 清华大学
地址 100084 北京市海淀区清华园1号
(10)申请公布号 CN110806759A
(43)申请公布日 2020.02.18
(72)发明人 游科友;董斐;宋士吉
(74)专利代理机构 北京清亦华知识产权代理事务所(普通合伙)
代理人 罗文群
(51)Int.CI
权利要求说明书 说明书 幅图
()发明名称
一种基于深度强化学习的飞行器航线跟踪方法
(57)摘要
本发明涉及一种基于深度强化学习的飞行
器航线跟踪方法,属于机器人智能控制领域。本方法首先构建飞行器轨迹跟踪控制的马尔科夫决策过程模型,分别得到飞行器航线跟踪控制的状态变量,控制变量,转移模型,一步损失函数的表达式;分别建立策略网络和评价网络;通过强化学习,使得飞行器在航线跟踪控制训练中每前进一步不断更新策略网络和评价网络,直至收敛;得到用于航线跟踪控制的最终策略网络。本
发明方法的可拓展性强,并不只适用于飞行器航迹跟踪控制问题,只需要重新设定状态变量、控制输入以及损失函数,调节神经网络的结构和参数即可拓展于飞行器控制的其他更加复杂的问题。
法律状态
法律状态公告日
2020-02-18 2020-02-18 2020-03-13
法律状态信息
公开 公开
实质审查的生效
法律状态
公开 公开
实质审查的生效
权利要求说明书
一种基于深度强化学习的飞行器航线跟踪方法的权利要求说明书内容是....请下载后查看
说明书
一种基于深度强化学习的飞行器航线跟踪方法的说明书内容是....请下载后查看
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- pqdy.cn 版权所有 赣ICP备2024042791号-6
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务