（同样值得注意的是，模型开发者正在花费大量金钱来收集糟糕的反-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

DevSarahCatanzaro

2 年前

truedevsarahcatanzaro

（同样值得注意的是，模型开发者正在花费大量金钱来收集糟糕的反馈数据；同样可以明显看出需要更好的数据整理策略来用于强化学习训练过程中的人类反馈）

CSDN App 扫码分享

分享

评论

14

复制链接
举报

下一条：

似乎许多模型开发者为了收集人类反馈/偏好数据而支付了大量金钱；我想知道，那些设计反馈循环以隐式收集偏好数据的初创公司，在未来后期培训更好模型方面是否可能会有优势...