热门

最新

红包

立Flag

投票

同城

我的

发布
algorithmtechninja
Ninja程序
1 年前
truealgorithmtechninja

Llama3的几个核心点:
1. 本体具备中文能力,对话时需要使用Prompt 以后请使用中文回答 来激发。期待社区的ft版本,估计很快。
2. 70B 性能碾压gpt-3.5-turbo,不足GPT-4。
3. 400B 是dense model,也是目前推理效率最低的模型(GPT-4是220B激活的MoE模型,总参数1.2TB左右)。性能号称和GPT-4持平,数月后放出。

最近国外开源模型真是一个锣鼓喧天,command r plus、mistral 8x22b、llama3,这三个模型已经是国内闭源模型顶尖水平。

400B一旦放出,那就是开源模型碾压国内的闭源模型,当然,写中文古诗的能力估计还不行。

CSDN App 扫码分享
分享
8
227
  • 复制链接
  • 举报
下一条:
今天AI领域的每个人https://llama.meta.com/llama3/
立即登录