我对所有这些LLM.C的看法是，它非常令人印象深刻，而且Ka-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_37071892

我对所有这些LLM.C的看法是，它非常令人印象深刻，而且Karpathy无疑是才华横溢的，但这在某种程度上是徒劳的，因为LLM.C永远不会像PyTorch那样快速或简单。

这整个“尽可能用最底层语言编写所有东西”的运动有点傻 —— 编译器实际上是好的！ —— 虽然具有教育意义，但编写在每个系统上都高效运行的代码需要大量的专业知识，并且需要处理很多边缘情况和优化。

如果你在最快模式下运行torch.compile（“最大自动调优”），它实质上会尝试所有这些功能上等效的低级实现，并对它们进行计时；然后它在最终执行的版本中每一步都采用最快的选项。

这就是编译器能做的事情。因此，如果你自己实现LLM训练，你将学到很多！但是当你对系统进行基准测试，只是为了意识到计算机能够编写比你更快的代码时，不要感到惊讶。

CSDN App 扫码分享

分享

19

205

复制链接
举报

下一条：

https://io.net 通过将使用不足的供应源聚合成一个去中心化的供应网络DePIN，降低了消费者的成本高达10倍，同时将供应商的利润提高了10倍。该网络通过在多个位置建立去中心化的GPU集群，创造了一种“结构性套利”，使得网络能够将供应商的利用率提高到接近100%。https://io.net 正在引发向更高效和灵活的计算转变，为AI公司提供服务，通过构建世界上最大的AI计算云，点燃了这场变革。