我最近开始对寻找Transformer模型的算法等价物感兴趣。几周前,我制作了一个关于这种机制解释的教程 (https://shorturl.at/SBsF0)。感谢 @思否小姐姐 和 @十八子向天 的支持!