Yolo-FastestV2:更快,更轻,移动端可达300FPS,参数量仅250k
发布网友
发布时间:2024-10-06 16:53
我来回答
共1个回答
热心网友
时间:2024-12-04 18:40
聚焦于速度与效率,Yolo-FastestV2以令人惊喜的速度跃升至顶尖行列,其在移动端的性能达到了惊人的300FPS,同时,参数量仅250k,这无疑在速度与轻量化之间找到了完美的平衡。
初探Yolo-Fastest的愿景,其目标是为轻量化目标检测提供新解,早期轻量化解决方案如Mobilenet-SSD虽在部分设备上展现出不俗的性能,但其在ARM设备上的实时性受限,尤其是在性能要求严格的工业级应用中,如RK3399等设备上,实现实时推理极为艰难。Mobilenet对Yolov3的轻量化优化虽在高端手机如Kirin 990上实现了约55fps的性能,却难以在低端手机CPU以及RK3399等设备上满足实时需求。
在实际应用中,考虑功耗与系统资源占用,多核全开推理模型并不符合实际场景。因此,Yolo-FastestV2着重优化单核推理性能,同时保持低CPU占用率,确保在多种嵌入式设备(如手机、RK3399、树莓派4、多种Cortex-A53低成本设备)上实现一定实时性,适应了更广泛的应用场景。
本次改进的核心在于更换backbone为shufflenetV2,优化内存访问,减轻计算负担。同时,借鉴YOLOV5的Anchor匹配机制与YoloX的检测头解耦技术,实现检测框、前景背景分类与检测类别分类的独立处理,提升推理效率。检测类别分类从sigmoid调整至softmax,进一步优化模型表现。
对比其他模型,如YOLOX和nanoDet,Yolo-FastestV2在精度上可能有所妥协,但其速度优势显著,特别是在移动端。体积仅1.3M的PP-YOLO Tiny与Yolo-FastestV2相比,在int8量化后,体积虽然稍逊一筹,但Yolo-FastestV2的int8版本仅250kb,性能上仍有明显优势。
结合RK3399与树莓派4,搭配ncnn与bf16s,Yolo-FastestV2展现出实时处理的强大能力。最终的实测效果展示了其在速度、效率与轻量化之间的卓越表现,使得模型成为多场景应用的理想选择。