训练一个像Llama3.1405B这样大而强大的模型并不是一-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

9 月前

truedevaiatmeta

训练一个像Llama 3.1 405B这样大而强大的模型并不是一件简单的任务。该模型在几个月的时间里使用了超过15万亿个标记进行训练，耗用了超过16,000块 @麻纪 H100 GPU，使其成为有史以来第一个在如此规模上进行训练的Llama模型。

我们还使用了405B参数模型来提高较小模型的训练后质量。

CSDN App 扫码分享

分享

3

40

复制链接
举报

下一条：

学习它。各州在人工智能和隐私监管方面独立行动 https://floridaphoenix.com/2024/07/21/states-strike-out-on-their-own-on-ai-privacy-regulation/ via @wlight Tseng