RLcode项目是一个强化学习教程，作者以尽量易懂的方式讲解-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

4 年前

trueshowmeai

RLcode 项目是一个强化学习教程，作者以尽量易懂的方式讲解了强化学习原理知识和实现代码。是一份很棒的强化学习入门教程，更多信息在这里 👉 https://blog.csdn.net/ShowMeAI/article/details/127150242

第一部分：概念
💦 马尔科夫链
💦 Q值和V值
💦 用蒙地卡罗方法（Monte-Carlo）估算V值
💦 用时序差分TD估算状态V值

第二部分：核心算法（附代码）
💦 Qlearning算法
💦 深度神经网络
💦 DQN算法
💦 Double DQN
💦 策略梯度（Policy Gradient）
💦 Actor-Critic
💦 argparse模块
💦 PPO算法
💦 DDPG算法
💦 TD3算法

CSDN App 扫码分享

分享

评论

2

打赏

复制链接
举报

下一条：

求助🆘 为什么登录微软账户时出现这样的问题啊？该怎么解决呢？求助好心人帮帮我

点击登录或者创建免费账户都还是这个界面，没办法登录？