《self-attention详解与计算过程》本文详细描述了self-attention结构的发展,从简单的网络开始逐步演化成self-attention结构,并描述的其中的矩阵运算,输入输出向量的来历 ——来自博客 https://blog.csdn.net/m0_46317132/article/details/120491670