深度学习中常用cat操作,将不同表征的信息融合在一起,也就是多个矩阵逐像素相加,但是我曾经想着逐像素相加形成少许几个矩阵,还能表示曾经的多个信息吗?比如特征金字塔将高分辨率和低分辨率这种,生产的新特征富含了高分辨特征和低分辨特征,怎么想想也觉得怪。
但是新的想法帮助我理解了这个问题,虽然只是突发奇想,不一定是对的。
我们知道比如光波、声波,当多个不同的来源叠加时,我们仍然能够将其分离,比如光纤通信,比如多个人同时给你讲话,虽然能量上叠加了,但是仍然能保持自己的特征。那么图像也是一种信息,可以理解为一种波,那么可能也能够在叠加时保持自己的特征,虽然在算法上只是简单的叠加了,实际上各种特征并没有改变,只是隐藏在了cat操作之下了。