包括程序操作录像
1.软件版本
matlab2022a
2.运行方法
使用matlab2022a或者高版本仿真,运行文件夹中的tops.m或者main.m。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。具体操作观看提供的程序操作视频跟着操作。视频播放使用windows media player播放。
3.部分仿真截图
4.内容简介
经过多轮训练后,Q 表已经学习到了不同状态下较优的动作策略。在实际路线搜索时,将机器人置于起点状态,然后在每一个状态下,直接选择 Q 值最大的动作(即采用贪婪策略,不再有探索概率 ),机器人按照选择的动作依次移动,直至到达终点,所经过的路径即为搜索到的最优路线(在 Q 表学习足够好的情况下,近似最优)。