最后，我们探索了语言预训练的效果。与预训练的大型语言模型相比-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

1 年前

trueweixin_36771744

最后，我们探索了语言预训练的效果。与预训练的大型语言模型相比，我们发现从头开始在合成分类任务上训练的transformers能够为未见过的分类问题学习到平滑的上下文决策边界。

CSDN App 扫码分享

分享

评论

11

复制链接
举报

下一条：

我们还探索了考虑不确定性的主动学习。通过为最不确定的数据点添加标签到上下文数据集中，我们可以更有效地平滑决策边界。