我们还在dm_control和MetaWorld的30和80-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_40489480

我们还在 dm_control 和 MetaWorld 的30和80多任务设置上测试了 PWM。在训练了一个大型多任务世界模型后，我们使用 PWM 在每个任务上提取策略的时间不到10分钟。我们分别比 TD-MPC2 超过了 27% 和 8%，而且无需在线规划！ 🧵

CSDN App 扫码分享

分享

评论

9

复制链接
举报

下一条：

KafKa 官方网站来自社区: 招聘信息共享社群, 频道: 技术官网, https://bbs.csdn.net/topics/619152785