热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_28937805
武冬青
3 年前
trueweixin_28937805

GPT生成的提示 => Midjourney生成的图像 => https://upscale.media 放大

CSDN App 扫码分享
分享
评论
12
  • 复制链接
  • 举报
下一条:
使用RLHF(奖励模型学习)替代指令微调的一个激励性启发,来自John的演讲:如果监督目标超出了预训练模型的权重范围,微调会鼓励其产生幻觉。https://www.youtube.com/watch?v=hhiLw5Q_UFg&t=3406s
立即登录