热门

最新

红包

立Flag

投票

同城

我的

发布
qq_51646682
Code_流苏
1 年前
trueqq_51646682

DeepSeek 开源第一天:FlashMLA

用于 Hopper GPU 的高效 MLA 解码内核,针对可变长度序列进行了优化,现已投入生产。

✅BF16 支持
✅分页 KV 缓存(块大小 64)
✅H800上的内存限制为3000 GB/s,计算限制为580TFLOPS

信息来源:deepseek 官方

CSDN App 扫码分享
分享
评论
2
打赏
  • 复制链接
  • 举报
下一条:
既然踏上了计算机这个专业,我感觉我们是不能遇到困难就害怕的,就像浙大c语言翁恺老师说的一样,学计算机,就是要有一个非常强大的心理状态,计算机的所有东西都是人做出来的,别人能想出来的,我们也一定能想出来,这些东西我只是现在不知道,总有一天我会把所有的细节,所有的内部的东西全都搞明白的。对于生活也是这样,我们也要有一个强大的心态来面对生活,不卑不亢的状态是最好的,你要努力,你要奋斗,一切都会来的,只是还在路上。最后送给每个人一句话: As long as you can still grab a breath,you fight.只要你一息尚存,就不能退缩!希望我们每个人都能做到,加油,努力向上的人。
立即登录