热门

最新

红包

立Flag

投票

同城

我的

发布
techsavvyarankomatsuzaki
KKyujin_
2 年前
truetechsavvyarankomatsuzaki

可扩展的无矩阵乘法语言模型

- 证明了在亿参数规模下,LLMs可以完全消除矩阵乘法操作,同时保持强大的性能
- 提供了一个GPU高效实现的模型,在训练期间相比未优化的基线减少了高达61%的内存使用

代码库:
https://github.com/ridgerchu/matmulfreellm
摘要: https://arxiv.org/abs/2406.02528

CSDN App 扫码分享
分享
5
62
  • 复制链接
  • 举报
下一条:
谷歌发布《相信还是不相信你的大语言模型》https://arxiv.org/abs/2406.02543
立即登录