热门
最新
红包
立Flag
投票
同城
我的
发布
umiyuki_ai
9 月前
trueweixin_41975548
我明白了LLM可以根据参数数量保存知识,但是如果像搭乐高积木一样,比如将专注于建筑知识的LLM和专注于编码知识的LLM通过MoE合成,那么是不是就能得到专注于建筑数字化转型的LLM呢?
下一条:
有人制作了LightChatAssistant的改良版本。在原始版本中,对ChatVector统一乘以0.8,而在这个版本中,他们使用了一种叫做TPE的方法,为不同层准备了50种不同的加权倍率方案,并通过基准测试选择了表现最佳的方案。
https://huggingface.co/Aratako/LightChatAssistant-2x7B-optimized-experimental
立即登录