李飞飞团队用了50刀,训练了26分钟,就复现DeepSeek R1,这么牛逼吗? 后来被人扒出这个模型是在阿里的通义千问大模型上进行的监督微调的,然后又通过蒸馏法从谷歌的Gemini2.0提炼出来1000个样本数据,进行训练得来的。其实也没怎么训练,就是让大模型背答案。他这个大模型看起来很吊,但数据量太小了。而且底座还是人家阿里云的,Qwen2.5大模型,这个大模型之前我吹过,非常牛逼的一个开源大模型。全球第七。李飞飞的大模型秘诀就一个:蒸馏,蒸馏意思是阿里云做好了预制菜,然后她的团队往里加了点调料。相当于用别人的面做自己的馒头呗,我们俗称AI酵母,发酵的酵。