热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_41244679
珍藏的动漫头像
2 年前
trueweixin_41244679

有没有人想过将强化学习(RL)与大语言模型(LLM)结合使用,使得动作空间可以通过各种层迭代地传递嵌入,或者添加随机噪声/其他可学习的变换,然后在认为准备好时使用单独的动作进行解码?

CSDN App 扫码分享
分享
评论
12
  • 复制链接
  • 举报
下一条:
Claude3.5 被破解了...任务:看看这个数据库,告诉我商业alpha在哪里.... gpto: 无聊且普通的列表...Claude?(如下)
立即登录