热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_34304538
永生花园艺 互互
1 年前
trueweixin_34304538

Phi-3 Mini 3.8b Instruct 已发布!!
68.8 MMLU 对比 Llama-3 8b Instruct 的 66.0 MMLU(Phi 团队自己的评估)

长上下文128K模型也已经发布,在
https://huggingface.co/microsoft/Phi-3-mini-128k-instruct 可以找到

正在努力将其加入 @走丢了猫!一些融合的线性模块需要解融化 :)
https://huggingface.co/microsoft/Phi-3-mini-4k-instruct

CSDN App 扫码分享
分享
评论
11
  • 复制链接
  • 举报
下一条:
制作了一个用于Llama-3 8B的Colab!支持15万亿个token!因此现在@走丢了猫也支持它了!使用免费的T4 GPU。正在进行基准测试,但速度大约快了2倍,内存使用量比HF+FA2少了80%!支持的上下文长度是HF+FA2的4倍。而且推理速度本身就快了2倍。https://colab.research.google.com/drive/135ced7oHytdxu3N2DNe1Z0kqjyYIkDXp?usp=sharing
立即登录