热门

最新

红包

立Flag

投票

同城

我的

发布
shi_hong_fei_hei
小虚竹 2022年度博客之星评选TOP 10
3 月前
trueshi_hong_fei_hei

第一次当主办方,新星杯创作挑战营第一期,圆满结束。
从热爱创作,到帮别人创作,坚持自己喜欢做的事,是一件很满足的事情。

保持热爱共赴山海
CSDN App 扫码分享
分享
评论
1
打赏
  • 复制链接
  • 举报
下一条:
有没有人想过将强化学习(RL)与大语言模型(LLM)结合使用,使得动作空间可以通过各种层迭代地传递嵌入,或者添加随机噪声/其他可学习的变换,然后在认为准备好时使用单独的动作进行解码?
立即登录