推文中的一些细节：-支持多语言和工具调用，性能媲美GPT-4-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

truealgorithmcodecrusher

推文中的一些细节：
- 支持多语言和工具调用，性能媲美 GPT-4
- 模型能够识别图像和视频，并支持通过语音进行交互，但这些功能仍在开发中，尚未准备好发布。
- 训练数据高达 15.6T tokens，使用了超过 16,000 个 H100 GPU
- 405B 模型能在单个服务器节点上运行
- 405B 模型训练好后，继续用 405B 模型提升了 8B 和 70B 的质量，所以可以预见 Llama 3.1 中 8B 和 70B 会有更好表现
- 大多数的监督微调（SFT）示例都是使用合成数据生成的

CSDN App 扫码分享

分享

1

22

复制链接
举报

下一条：

【🚨LLAMA 3.1 已发布！这是一款开源的 AI 模型，您可以对其进行微调、蒸馏和部署在任何地方。它有 8B、70B 和 405B 版本。这里是您需要了解的一切以及如何试用的方法：】