热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_35805055
小小二-yan
1 年前
trueweixin_35805055

🤖 来自本周的期刊:一篇讨论剪枝和蒸馏最佳实践的文章,并展示了将这些方法应用于Llama 3.1 8B模型以获得Llama-3.1-Minitron 4B模型的有效性。
https://developer.nvidia.com/blog/how-to-prune-and-distill-llama-3-1-8b-to-an-nvidia-llama-3-1-minitron-4b-model/

CSDN App 扫码分享
分享
1
9
  • 复制链接
  • 举报
下一条:
一直以来我都很困惑,像是制作Llama.cpp的Gerganov先生、制作WebUI的AUTO先生、制作ComfyUI的ComfyAnonymous先生,以及让LoRA在世界范围内流行的Kohya先生这样的人,他们以极大的热情为AI圈子做出了巨大的贡献,但这样他们能赚到钱吗?如果完全没有回报的话,那开源软件开发到底是为了什么呢……
立即登录