热门

最新

红包

立Flag

投票

同城

我的

发布
devaiatmeta
云端~
2 年前
truedevaiatmeta

现在这些模型还处于早期阶段,我们对未来的创新感到非常兴奋。今天发布的Llama 1B和3B权重是基于BFloat16数值的。我们的团队正在积极探索运行速度更快的量化变体,希望很快能分享更多相关信息。

CSDN App 扫码分享
分享
5
62
  • 复制链接
  • 举报
下一条:
结合在 NVIDIA H100-80GB 上训练这些轻量级 Llama 模型需要 91.6 万 GPU 小时。作为 Meta 自 2020 年开始的承诺的一部分,我们在全球运营中保持了净零温室气体排放,并通过可再生能源匹配了训练操作中 100% 的电力使用。由于我们公开发布这些模型,其他人将无需承担训练能源使用和温室气体排放。
立即登录