热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_40348090
Mia-张
2 年前
trueweixin_40348090

训练庞大的大型语言模型(LLM)真是荒谬。他们实际上只是在增减一堆权重,盯着图表做出一些愚蠢的表情,直到得出某个数值。如果他们在进行强化学习的微调(RLHF),那么这个数值就像被装进一个小塑料袋里,他们得去处理这个数值袋子。这不是一项认真的事业。成熟些吧。

CSDN App 扫码分享
分享
评论
22
  • 复制链接
  • 举报
下一条:
今天作业好多呀,不知道初中得有多恐怖,难以置信!
立即登录