【@皮孩爱球孩 @古德一雾宁 在这篇文章中讨论了这个问题,但这对于前沿模型研究者来说更有用,而不是我们这些GPU贫民/GPU中下阶层。而且前沿模型论文中的数据配方在外部是不可复现的。 https://www.interconnects.ai/p/frontier-model-post-training】