热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_32022143
Wang Hawk
2 年前
trueweixin_32022143

整个关于模型性能是GPT-4的100倍的说法必须是虚张声势吧?使用25000个A100运算卡3个月的时间,将这个规模增加100倍并非易事。我甚至还没有谈到推断成本和所需的训练数据。

CSDN App 扫码分享
分享
1
15
  • 复制链接
  • 举报
下一条:
在为时不晚之前,我们能否重新定义RLHF为直接从人类获取反馈,而不是从奖励模型中获取?请目前所称的RLHF,应该被称为RLAIF目前所称的RLAIF,应该被称为零次RLAIF,因为没有使用反馈例子。
立即登录