热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_42525353
野之风
2 年前
trueweixin_42525353

torch.compile 很酷,但是 LLM compile 更厉害:它接受你的 .py 仓库作为字符串,并输出一个全新的、定制的、从头开始的、最小化代码仓库,直接在高度优化的 CUDA 上运行你的网络。

CSDN App 扫码分享
分享
14
447
  • 复制链接
  • 举报
下一条:
在长时间勤奋地编写同一段代码中有一种非常特别的满足感;每天我修复一些小问题,这些问题总是让我感到烦恼,或者增加一个偶尔有用的指标,或者让某个部分运行得稍微快一点。随着时间的推移,这些微优化确实会产生积累效应,并给我带来一定的自豪感。现在一切都运行得非常好。
立即登录