提出了一种时间移位模块(Temporal Shift Module ,TSM)它能够嵌入到二维卷积神经网络中,使二维卷积神经网络可以高效的进行时间建模。
具体的,我们可以将一个视频用 A ∈ 𝑅𝑁×𝐶×𝑇×𝐻×𝑊进行表示,这里 N 代表 batch size,C 代表视频的通道数,H 和 W 代表视频帧的分辨率,T 代表时间 维度,通常的 2D 卷积是不依赖时间维度的
如图 2.2 左图所示,相同的颜色的方块 代表一个时间点的卷积图。而 TSM 会将 2D 卷积运算得到的卷积图的通道在时间维 度上进行向前或向后的移动,如图 2.2 所示,将一个卷积图的部分通道沿着时间维度 -1 或+1。
理论上对卷积图的通道进行时间维度上的移位不会有计算上的损耗,但是通过实验发现这样是效率不高的并且表现不佳,因为这样操作需要大量的数据移动,这是消耗时间的。
(一)通过对卷积图的部分通道移位代替全部通道的移位来减少数据移动的损耗,TSM 通过对转移通道的不同比例对时间延迟的影响展开了实验,发现随着转移通道的比例增加延迟也随之增加。
(二) 通过实验发现设置不同比例的通道转移可以有不同的延迟损耗,同时也具有对性能的 提升也有不同的影响,该论文对比了不同转移比例对性能的影响,发现转移 1/4 的通 道数可以取得一个较好的性能,同时保证较小的时间延迟。通过实验对比发现,采用相同 backbone 网络的 TSM 二维卷积网络与 I3D 三维卷积网络,TSM 二维卷积的网络 参数更少,网络延时比 I3D 网络低很多。 另外,它们也提出了采用残差结构,因为残差结构有两条路径,这样就可以使得一条路径用来进行时间移位操作,另一条路径还可以保留原有特征,而本文因为使用的是 ResNet50 残差网络,所以本文也采用了该残差结构,本文的 TSM-ResNet50 网络 的残差块大体可以用图 2.3 表示。
到此这篇convlstm2d(convlstm2d怎么导入)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/cjjbc/67072.html