问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

基于图注意力单元的改进SiamFC++的单目标追踪系统

发布网友 发布时间:2024-10-24 18:35

我来回答

1个回答

热心网友 时间:2024-11-01 14:49

随着计算机视觉技术的进步,单目标追踪(SOT)在多个实际应用中得到广泛应用,如智能监控、交通管理和无人驾驶。然而,目标外观变化、遮挡和光照变化等因素给SOT任务带来挑战。基于深度学习的方法在SOT领域取得了显著进展。

SiamFC是一种基于孪生网络的方法,通过编码目标和背景为两个特征图,计算它们之间的相似度实现目标跟踪。但SiamFC在处理复杂场景和目标变化时仍存在局限性,如目标遮挡和光照变化。因此,研究者们提出了许多改进方法,其中图注意力单元(Graph Attention Unit)作为一种有效的注意力机制,能够在图结构数据上学习目标的相关性和重要性,提高SiamFC模型对目标的关注度,从而提高单目标追踪的准确性和鲁棒性。

本研究旨在基于图注意力单元的改进SiamFC++的单目标追踪系统。通过引入图注意力单元,我们设计了一种新的网络结构,将图注意力单元嵌入到SiamFC模型中,提高模型对目标的关注度和区分度。同时,我们还探索了不同的注意力机制和损失函数,以进一步提高模型的性能。本研究的意义主要体现在以下几个方面:提高SiamFC模型在复杂场景和目标变化下的追踪性能;推动深度学习在SOT领域的应用;为实际应用提供更准确、鲁棒的单目标追踪解决方案。

近年来,计算机视觉引起了学界的广泛关注。单目标追踪作为计算机视觉的重要研究方向之一,在研究过程中除了追求准确性之外还要保证实时性,以提高现实适用性。本章针对实时单目标追踪问题,利用双边加权最小二乘模糊支持向量机,提出了基于多特征融合的实时追踪算法FSCFI4]。实验结果表明,与已有的高性能单目标追踪算法相比,所提FSCF算法在形变、快速运动、运动模糊等多个方面均表现出了更优的追踪性能。

图像相似度计算是计算机视觉和图像分析中最基本的任务之一,在诸多视觉任务中发挥着重要作用。双通道网络的核心思想在于将孪生网络的双分支合并在一起。孪生网络和双通道网络的网络架构图如图所示。与孪生网络相比,双通道网络共同处理了两个patch,提供了更大的灵活性。通过实验,Zagoruyko等证明了双通道网络不仅训练速度更快,而且模型精度更高。

Graph_Attention_Union.py是一个名为Graph_Attention_Union的神经网络模型类,它继承自nn.Module和ABC类,并包含了一些卷积层和线性变换层。该模型类的初始化函数接受两个参数:in_channel和out_channel,分别表示输入通道数和输出通道数。模型的前向传播函数forward接受两个输入zf和xf,分别表示搜索区域节点和目标模板节点。整个模型的目的是实现图注意力机制,用于处理图结构数据的特征提取和聚合。

SiamFC_plus.py是一个用于目标跟踪的Siamese网络的实现,它包含了三个主要的模块:特征提取模块、Siamese网络架构和损失函数。特征提取模块是一个简单的卷积神经网络,它包含了三个卷积层,用于从输入图像中提取特征。Siamese网络架构包含了一个特征提取模块和两个头部(Classification head和Regression head)。损失函数定义了Siamese网络的训练损失,包含了两个部分:分类损失和回归损失。

双通道网络和孪生网络最大的区别在于,孪生网络是在最后的全连接层中才将两张图片的相关神经元关联在一起,而双通道网络则是从最初就将输入的两张图片联系在一起。与孪生网络相比,双通道网络共同处理了两个patch,提供了更大的灵活性。本节将双通道网络引入到单目标追踪领域中,提出了一个融合双通道网络和SiamFC的实时单目标追踪算法SiamFC_plus。

网络的前向传播过程是按照从前往后的顺序,从输入层开始经由隐藏层到达输出层,逐层计算出各个网络层的激活值,最后得到网络输出值。网络一共有L=9层,结合表6-1可知其中包括了1个输入层,5个卷积层,2个池化层,1个全连接层。第1层是输入层,输入目标模板图像z和搜索区域图像x,以z为滤波器,在每个颜色通道上对x做互相关操作,其输出为:

完成前向传播过程后,开始进行网络的反向传播。反向传播过程是按照从后往前的顺序,从输出层开始经由隐藏层到达输入层,逐层计算出每个网络层的误差项,进而计算各层网络参数的梯度,最后根据梯度值更新各层网络参数。

以往的跟踪器都通过模板分支和搜索分支之间的互相关实现相似性学习。原算法的作者认为这种方式存在以下缺点:以往跟踪器一般是以目标中点为中心取m*m大小的区域作为模板,这会导致提取到部分背景信息或者丢失部分目标信息。本文只提取目标所在bbox区域作为模板帧。以往跟踪器互相关是将提取到的模板特征在搜索区域上做全局搜索,无法适应旋转、姿态变化、遮挡等情况。

GAM:提出图注意力模块(Graph Attention Module),有效将目标信息从模板特征传递至搜索特征。SiamGAT:在SiamCAR基础上做了改进,设计 target-aware 的选择机制以适应不同目标的大小和长宽比变化。整体网络结构如图,特征提取使用GoogleNet,头部和SiamFC++一样。

下图完整源码&数据集&环境部署视频教程&自定义UI界面。参考博客《基于图注意力单元的改进SiamFC++的单目标追踪系统》。

[1] 杨晓伟, 黄滢婷. 基于多特征融合的实时单目标追踪算法[J]. 华南理工大学学报(自然科学版).2019,(6).DOI:10.12141/j.issn.1000-565X.180439 .

[2] Tsung-Yi,Lin, Priyal,Goyal, Ross,Girshick,等. Focal loss for dense object detection.[J].IEEE Transactions on Pattern Analysis & Machine Intelligence.2018,(Spec).DOI:10.1109/TPAMI.2018.2858826 .

[3] Mingming Lv, Li Wang, Yuanlong Hou,等.Mean Shift Tracker With Grey Prediction for Visual Object Tracking[J]. Canadian journal of electrical & computer engineering.2018,41(4).172-178.DOI:10.1109/CJECE.2018.2875142 .

[4] Bourque, Alexandra E., Bedwani, Phane, Carrier, Jean-Francois,等. Particle Filter-Based Target Tracking Algorithm for Magnetic Resonance-Guided Respiratory Compensation: Robustness and Accuracy Assessment[J].International Journal of Radiation Oncology, Biology, Physics.2018,100(2).325-334.DOI:10.1016/j.ijrobp.2017.10.004 .

[5] Liu, Huaping, Yu, Yuanlong, Sun, Fuchun,等. Visual-Tactile Fusion for Object Recognition[J].IEEE transactions on automation science and engineering: a publication of the IEEE Robotics and Automation Society.2017,14(2).996-1008.DOI:10.1109/TASE.2016.2549552 .

[6] Zhang, Le, Suganthan, Ponnuthurai Nagaratnam. Robust visual tracking via co-trained Kernelized correlation filters[J].Pattern Recognition: The Journal of the Pattern Recognition Society.2017.6982-93.

[7] Baochang Zhang, Zhigang Li, Xianbin Cao,等.Output Constraint Transfer for Kernelized Correlation Filter in Tracking[J].IEEE Transactions on Systems, Man, and Cybernetics: Systems.2017,47(4).693-703.DOI:10.1109/TSMC.2016.2629509 .

[8] Yoon, Kuk-Jin, Yoon, Ju Hong, Yang, Ming-Hsuan. Interacting Multiview Tracker[J].IEEE Transactions on Pattern Analysis & Machine Intelligence.2016,38(5).

[9] Hare, Sam, Golodetz, Stuart, Saffari, Amir,等. Struck: Structured Output Tracking with Kernels[J].IEEE Transactions on Pattern Analysis & Machine Intelligence.2016,38(10).

[10] Henriques, Joao F., Caseiro, Rui, Martins, Pedro,等. High-Speed Tracking with Kernelized Correlation Filters[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2015,37(3).583-596.DOI:10.1109/TPAMI.2014.2345390 .
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
福建南安都有哪些市场 端午节去南安旅行的线路有哪些值得分享? 南安有哪些特色商业街 把一个棱长是10厘米的正方体铁块熔铸成一个底面积是20厘米的圆锥形铁块... 把一块棱长10厘米的正方体铁块熔铸成一个底面直径是20厘米的圆柱形零件... 0x0438ef0指令引用的0x0438ef0内存.该内存不能为“read”的错误提示... SONY 索尼 DSC-RX100M5A 1英寸数码相机 黑色(8.8-25.7mm、F1.8) Vl... SONY 索尼 DSC-RX100M5A 1英寸数码相机 黑色(24-70mm、F1.8-F2.8)-购... 索尼RX100 M5A数码相机 索尼RX100 M5A数码相机:小巧便携,成像卓越 75升15度的水加热到100度,用20-30分钟,须要多少瓦的发热管 ...直接加热1T水,从15摄氏度到100摄氏度,需要多少立方蒸汽,换算KW数... [Y,Zf] = FILTER(B,A,X,Zi) 中如何求Zf 我要在电脑加一个内存条,但加好后却发生冲突,怎么设置BIOS呢? 我公司是以小规模纳税人,报税是我的专管员帮弄的。现在年检 需要资产... 世界上面积第三大的国家不是中国吗? 给电脑加了一个内存条,但是今天去BIOSS里看,内存条的频率下降了?会有什... 最近有人叫我上班,我做梦梦见老板给我发工资 什么是相对论.它还有什么作用以及生活当中的运用 鹰嘴豆做法家常做法 ...主机箱上的耳机和麦克风的插孔插入耳机听不到声音也没有声音输入_百... 电脑经常没声音,要么音响耳机都没有,要么耳机没有,要么麦克风没有,快... 伦敦失联女博士住处发现其尸体,留学生活都不太平吗 情人之间为什么要送巧克力 男孩可不可以随便送女孩巧克力呀? 1.5匹美的变频空调产品型号推荐 豆豉扇贝是什么 蒜香豆豉蒸扇贝做法 ...路径狭窄——并且风险大,在这个行业里要吗?就趁早转行, 美女们,你们都是喜欢穿什么样式和颜色的内衣裤啊!诚实的回答!_百度... 刚才梦见自己上面牙齿全部松动掉落,没有出血,自己又含了回去赶紧去找... T型路口发生交通事故责任如何分 t型路口交通事故责任怎么划分! “先辈匣中三尺水”的出处是哪里 三国志战棋版步练师阵容怎么搭配-步练师阵容搭配推荐 三国志战棋版98选谁-98自选阵容搭配攻略 神雕侠侣2手游微氪玩家消费指南 哪些道具值得购买 神雕侠侣2手游平民玩家元宝商城礼包购买推荐 神雕侠侣2手游成长基金值得购买吗 全部奖励介绍 清明节你做了什么作文400字左右 上饶市卓优母婴用品有限公司怎么样? 神雕侠侣2手游首充值得购买吗 最低充值多少能解锁 “鲁儒犹逐断蓬来”的出处是哪里 神雕侠侣2手游元宝商场哪些道具值得购买 优先买什么 在有红绿灯的T字路口和直行车辆相撞是谁的责认 上饶市卓优母婴用品有限公司怎么样? 在农村由于杂物放在T型路口(马路边上)导致的交通事故,杂物所有人有责任... 眇莽的解释眇莽的解释是什么 舍基本信息 “身有鲁儒名”的出处是哪里