热门
最新
红包
立Flag
投票
同城
我的
发布
《TensorFlow 深度强化学习应用》
我们使用TensorFlow定义一个简单的深度神经网络来逼近Q值函数。该网络输入为状态state,输出为每个动作的Q值。])这里,我们的网络包含两个全连接层,每个层有24个神经元。输出层的大小等于动作空间的大小,每个输出表示对应动作的Q值。DQN代理类负责与环境交互,执行动作,存储经验,并训练神经网络。import gym# 创建Q网络return# 转换为numpy数组# 计算Q目标# 更新Q网络# 更新ε。
——来自博客 https://blog.csdn.net/sjdgehi/article/details/146415943
好理解吗?(单选)
0 人已经参与 已结束
好
0人
不好
0人
CSDN App 扫码分享
评论
点赞
- 复制链接
- 举报