热门
最新
红包
立Flag
投票
同城
我的
发布
RLcode 项目是一个强化学习教程,作者以尽量易懂的方式讲解了强化学习原理知识和实现代码。是一份很棒的强化学习入门教程,更多信息在这里 👉 https://blog.csdn.net/ShowMeAI/article/details/127150242
第一部分:概念
💦 马尔科夫链
💦 Q值和V值
💦 用蒙地卡罗方法(Monte-Carlo)估算V值
💦 用时序差分TD估算状态V值
第二部分:核心算法(附代码)
💦 Qlearning算法
💦 深度神经网络
💦 DQN算法
💦 Double DQN
💦 策略梯度(Policy Gradient)
💦 Actor-Critic
💦 argparse模块
💦 PPO算法
💦 DDPG算法
💦 TD3算法
CSDN App 扫码分享
评论
2
打赏
- 复制链接
- 举报
