Cross Attention(交叉注意力)它用于处理两个不同模态序列之间的关联,在多模态场景中用于将文本和图像等不同类型的数据进行交互处理。https://mp.weixin.qq.com/s/hFG1z5eLoEeOGIb8bLq08Q