小面包 面包多
简介
评论
作品封面
永久回看

基于Qlearning强化学习的倒立摆控制系统matlab仿真,包括程序操作录像

¥22 已有12人购买
投诉
头像
我爱C编程 1.有问题请发本人邮箱1480526168@qq.com,勿发平台私信。 2.程序只用于个人学习,禁止二次销售;
作品简介

1.软件版本

matlab2022a

2.运行方法

     使用matlab2022a或者高版本仿真,运行文件夹中的tops.m或者main.m。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。具体操作观看提供的程序操作视频跟着操作。

3.部分仿真截图

4.内容简介

强化学习通常包括两个实体agent和environment。两个实体的交互如下,在environment的statestst下,agent采取actionatat进而得到rewardrtrt 并进入statest+1st+1。Q-learning的核心是Q-table。Q-table的行和列分别表示state和action的值,Q-table的值Q(s,a)Q(s,a)衡量当前states采取actiona到底有多好。

创作时间:2022-11-08 17:45:57

付费22元可获得

评论 100% 推荐

暂时还没有评论


头像
我爱C编程 1.有问题请发本人邮箱1480526168@qq.com,勿发平台私信。 2.程序只用于个人学习,禁止二次销售;
关注
38 喜欢 2 关注 2701 粉丝 859 作品

在您购买本平台付费作品前,请您认真阅读本声明内容。如果您对这份声明没有异议,则可以继续购买 >>>

  • 主页
  • 私信
登录或购买

基于Qlearning强化学习的倒立摆控制系统matlab仿真,包括程序操作录像

作品简介

1.软件版本

matlab2022a

2.运行方法

     使用matlab2022a或者高版本仿真,运行文件夹中的tops.m或者main.m。运行时注意matlab左侧的当前文件夹窗口必须是当前工程所在路径。具体操作观看提供的程序操作视频跟着操作。

3.部分仿真截图

4.内容简介

强化学习通常包括两个实体agent和environment。两个实体的交互如下,在environment的statestst下,agent采取actionatat进而得到rewardrtrt 并进入statest+1st+1。Q-learning的核心是Q-table。Q-table的行和列分别表示state和action的值,Q-table的值Q(s,a)Q(s,a)衡量当前states采取actiona到底有多好。

创作时间:2022-11-08 17:45:57