Nvidia最近提交的MLPerf测试有一个有趣的细节——他们启用了一个加速滑块,将电力从L2缓存重定向到张量核心!如果你对为什么这样做可能有帮助感到好奇,我的博客文章可能会很有趣!https://www.thonking.ai/p/strangely-matrix-multiplications