发布网友 发布时间:2022-11-24 18:02
共1个回答
热心网友 时间:2024-01-26 02:20
由于3DCNN在处理视频数据的良好表现,从而将3D卷积引入到ResNet网络中。将3D-ResNet在 ActivityNet 和 Kinetics 进行训练,记过发现在ActivityNet上出现了过拟合,而在大数据量的Kinetics上的表现优于C3D等网络。
因为在ImageNet预训练的模型应用很广泛,作者希望可以仿照2DCNN预训练模型的成功,提供基于3DResNet在 Kinetics 预训练的结果。
作者基于ResNet-18通过在各个数据集上的测试,证明了仅为18层的网络在小数量的数据集 UCF101 、 HMDB-51 、ActivityNet上出现了过拟合,而在数据量最为充分的Kinects上表现最好。如果希望在UCF101等小数据集上得到较高的准确率,可以基于kinects预训练的模型进行微调。下图是在UCF101和HMDB-51上微调的结果:
热心网友 时间:2024-01-26 02:20
由于3DCNN在处理视频数据的良好表现,从而将3D卷积引入到ResNet网络中。将3D-ResNet在 ActivityNet 和 Kinetics 进行训练,记过发现在ActivityNet上出现了过拟合,而在大数据量的Kinetics上的表现优于C3D等网络。
因为在ImageNet预训练的模型应用很广泛,作者希望可以仿照2DCNN预训练模型的成功,提供基于3DResNet在 Kinetics 预训练的结果。
作者基于ResNet-18通过在各个数据集上的测试,证明了仅为18层的网络在小数量的数据集 UCF101 、 HMDB-51 、ActivityNet上出现了过拟合,而在数据量最为充分的Kinects上表现最好。如果希望在UCF101等小数据集上得到较高的准确率,可以基于kinects预训练的模型进行微调。下图是在UCF101和HMDB-51上微调的结果: