热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_40489480
gajet
2 年前
trueweixin_40489480

这意味着 PWM 能更有效地扩展到亿级参数模型。令人难以置信的是,多任务 PWM 几乎匹配了单任务专家如 DreamerV3 和 SAC 的表现。

查看论文、代码和模型:
https://imgeorgiev.com/pwm

CSDN App 扫码分享
分享
评论
11
  • 复制链接
  • 举报
下一条:
我们还在 dm_control 和 MetaWorld 的30和80多任务设置上测试了 PWM。在训练了一个大型多任务世界模型后,我们使用 PWM 在每个任务上提取策略的时间不到10分钟。我们分别比 TD-MPC2 超过了 27% 和 8%,而且无需在线规划! 🧵
立即登录