热门
最新
红包
立Flag
投票
同城
我的
发布
小虚竹
2022年度博客之星评选TOP 10
3 月前
trueshi_hong_fei_hei
第一次当主办方,新星杯创作挑战营第一期,圆满结束。
从热爱创作,到帮别人创作,坚持自己喜欢做的事,是一件很满足的事情。
保持热爱共赴山海
下一条:
有没有人想过将强化学习(RL)与大语言模型(LLM)结合使用,使得动作空间可以通过各种层迭代地传递嵌入,或者添加随机噪声/其他可学习的变换,然后在认为准备好时使用单独的动作进行解码?
立即登录