热门

最新

红包

立Flag

投票

同城

我的

发布
sjdgehi
一碗黄焖鸡三碗米饭
9 月前
truesjdgehi

《TensorFlow 深度强化学习应用》
我们使用TensorFlow定义一个简单的深度神经网络来逼近Q值函数。该网络输入为状态state,输出为每个动作的Q值。])这里,我们的网络包含两个全连接层,每个层有24个神经元。输出层的大小等于动作空间的大小,每个输出表示对应动作的Q值。DQN代理类负责与环境交互,执行动作,存储经验,并训练神经网络。import gym# 创建Q网络return# 转换为numpy数组# 计算Q目标# 更新Q网络# 更新ε。
——来自博客
https://blog.csdn.net/sjdgehi/article/details/146415943

好理解吗?(单选)
0 人已经参与 已结束
好
0人
不好
0人
CSDN App 扫码分享
分享
评论
点赞
  • 复制链接
  • 举报
下一条动态
立即登录