我们撰写了一篇立场论文,主张我们应该将大型生成模型以组合的方式从较小的模型构建起来!我们认为这样做(1)可以实现数据/计算高效学习;(2)可以实现对未见测试分布的可证明泛化。https://arxiv.org/abs/2402.01103