有没有人想过将强化学习（RL）与大语言模型（LLM）结合使用-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

珍藏的动漫头像

2 年前

trueweixin_41244679

有没有人想过将强化学习（RL）与大语言模型（LLM）结合使用，使得动作空间可以通过各种层迭代地传递嵌入，或者添加随机噪声/其他可学习的变换，然后在认为准备好时使用单独的动作进行解码？

CSDN App 扫码分享

分享

评论

12

复制链接
举报

下一条：

Claude3.5 被破解了...任务：看看这个数据库，告诉我商业alpha在哪里.... gpto: 无聊且普通的列表...Claude？（如下）