流行的扩展规律只考虑了训练成本，而忽略了部署成本。在2024-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_40733044

流行的扩展规律只考虑了训练成本，而忽略了部署成本。在2024年 @大麦的Eddy会议上，@Hvyntivka Mosina Mosaic AI研究人员Nikhil Sardana、@Damien丶和@隐隐最靓的崽提出了一种修改后的扩展规律，该规律同时考虑了训练和推理的成本，并通过实验演示了如何“过度训练”的大型语言模型（LLM）可以成为最佳选择：https://www.databricks.com/blog/how-long-should-you-train-your-language-model

CSDN App 扫码分享

分享

1

22

复制链接
举报

下一条：

幸福就是客户在他们的整个应用程序中一秒钟内切换到最新的大型语言模型。👊