问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

北京大数据竞赛一等奖方案-漆面缺陷检测

发布网友 发布时间:2024-10-08 18:43

我来回答

1个回答

热心网友 时间:2024-10-11 14:53

传统制造业在检测喷涂颜色件的漆面质量时,大多依赖人工目视检查,这种方法受环境、视觉能力和人员状态等不可控因素影响较大,存在观察难度大、缺陷漏检、质量难以保证和效率低等问题。借助机器视觉技术,如深度学习,实现常见漆面缺陷的自动检测识别,对于提高检测的可靠性、经济性和效率具有重要意义。

除了人工目视和边缘检测算子加机器学习,基于深度学习的机器视觉技术在近年来逐渐受到关注。然而,现有的深度学习缺陷检测方法大多只是将缺陷框出(目标检测),而将缺陷区域像素级别提取出来(语义分割)更贴近实际应用场景需求,同时也更具挑战性。

大赛网址:北京大数据技能大赛

比赛提供了203张含有缺陷的图像,要求实现对缺陷的像素级别提取。

像素级缺陷提取存在诸多难点。

3. 方案

3.1 轻量化的MobileUNet+

由于缺陷面积小,样本数量少,如果模型深度太深和参数太多,容易造成过拟合。因此,我们设计了一种全卷积神经网络MobileUNet+来分割漆面瑕疵。Unet总体框架可以更好地融合高层和底层特征,恢复精细边缘。我们使用mobilenetV2作为编码器,利用倒残差结构在控制参数量的同时提高特征提取能力。

3.2 空间通道注意力

为了解决与缺陷相似的非缺陷误区域误检测问题,我们在解码器中嵌入空间通道联合注意力机制scSE,实现对特征的正向校正。

3.3 损失函数

大量的简单背景样本可能会淹没整个交叉熵损失,我们利用OHEM过滤掉交叉熵小于设定阈值的样本点。为进一步缓解正负样本数量不均衡现象,加入Dice损失。

3.4 数据增强

数据增强可以扩充数据,减轻模型过拟合现象。除了常规的亮度变换、翻转旋转、平移缩放之外,我们开发了一种针对漆面缺陷的K-means约束的copy-paste增强方法。由于漆面一般是曲面,图像中有些区域比较亮,有些区域比较暗,如果直接复制粘贴不同光线分布的缺陷实例,可能会对模型学习产生负面影响。因此,我们首先对图像进行K-means聚类,在复制粘贴时只粘贴到相同光线分布的区域。这样一来,在降低copy-paste可能带来的负面影响的同时,增加正样本的数量和背景多样性。

3.5 随机权重平均SWA

随机权重平均SWA:在优化的末期取k个优化轨迹上的checkpoints,平均他们的权重,得到最终的网络权重,这样会缓解权重震荡问题,获得一个更加平滑的解,相比于传统训练有更泛化的解。我们在训练的最后5轮使用了SWA集成多个模型的权重,得到最终模型结果。

3.6 torch转ONNX

为什么要转ONNX(Open Neural Network Exchange,开放式神经网络交换):直接原因是比赛统一要求;根本原因是ONNX支持大多数框架下模型的转换,便于整合模型,并且还能加速推理,更可以方便地通过TensorRT或者openvino部署得到进一步提速。

3.6.1 安装onnx和onnxruntime

onnxruntime-gpu需要和cuda版本对应,在此处查询。

验证是否可用:

ONNX的providers说明:Pypi上的官方Python包仅支持默认CPU(MLAS)和默认GPU(CUDA)执行提供程序。对于其他执行提供程序(TensorrtExecutionProvider),您需要从源代码构建。请参阅构建说明。Official Python packages on Pypi only support the default CPU (MLAS) and default GPU (CUDA) execution providers. For other execution providers, you need to build from source. Please refer to the build instructions. The recommended instructions build the wheel with debug info in parallel.

3.6.2 模型转换

4. 结果

大赛要求的基准精度为IoU不能小于65%,而我们的模型IoU达到了77%,增量达到了12%。模型精度得分达到了85%。更可喜的是,模型的推理速度特别快,单张推理时间为9.1ms,意味着每秒可以处理110张图像。除了可以定位检测外,缺陷的面积、长宽等属性也会一并提取出来,这将为后续处理提供更多实用信息。85%的模型精度、110FPS的推理速度、加上丰富的缺陷形态信息,我们的方案完全可以满足实际应用场景的需求。

5. 代码开源

6. 答辩视频参考
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
宜昌夷陵区丶西陵区哪个区最繁华 宜昌哪些地方租房子好 宜昌CBD中心商务区项目分段定位 宜昌哪个地段房子好 奥迪a6油箱盖按键在什么位置 奥迪a6汽车加油盖按钮在哪 奥迪a6油箱盖怎么开 奥迪a6油箱盖的开关在哪里 图文结合带你搞懂MySQL日志之Error Log(错误日志) 变电站电磁辐射安全标准 ...马自达车辆搭载创驰蓝天GVC系统技术的好处是什么? GVC是什么鬼?你们知道么? ...才敢把EDC做成迷你战术重折!强硬的Strider挺进者PT3代 遨游中国2在华军软件园的下载流程是什么? 白化病伴性遗传怎么治 手机版遨游中国怎么下载 遨游中国下载方法 ...真正防抖)、拍摄远距离拉近镜头 也很清楚的 数码相机 苹果6能否将远景拉近后再拍摄 大型水泥管生产厂家 我参加了今年江西省招警考试,现在分数出来了,不是很理想,谁能为我支... 招警考试和政法干警考试有什么 去区别啊?哪个好考,我该怎么学习? 江西招警面试培训哪个机构的比较好呢? 江西招警考试面试培训赣州有木有?我人在赣州,有没有培训过的亲分享下... 苹果哪个软件可以免费看最新电影 ...共分3幕·里面的藏骨集团,约翰布莱克是虚拟的还是真实的_百度... ...言情,恐怖的。最好的探秘有关的。。。谢谢大侠们。。。 iphone4s手机如何输入约等于号? iphone4s 怎么打&符号(没有越狱) 我的是中国银行信用卡,账单日为每月7号,那我在账单日后几天刷卡消费可以... ps怎么重启设置ps重启设置全部复位 ps复位基本功能ps复位基本功能在哪里快捷键 韩剧时尚王第7集在10:12时有一首女声的插曲是什么?非常感谢 虾仁的做法大全家常虾仁的做法有哪些呢 如果有一个爱情水晶球能预知是否会和现任白头偕老,要不要使用它 ...人必须遵守中华人民共和国的法律 ,体现了我... 中华人民共和国外国人入境出境管理法第一章 总则 ...有了一个王葆的宝葫芦要什么有什么你想用它做什么会发生什么奇妙的故... 我给 男朋友 要分 手了 我帮 他 借了 钱 我能 向他 要了 还 别人 吗 承包食堂、食材配送价格多少? 借给好朋友一万块钱,一直不提,我继续等吗? 交往一个月的男朋友借我一万块说第二天还可第二天没还怎么办?向我借钱... 食堂承包商哪家比较有规模?食堂承包托管资质教好的。 从日照到临朐,走高速从哪站下最近,谢谢 梦见蟒蛇追别的女人被我打死,又来一条追我是什么意思 长深高速山东段通车了,开车苏州到山东临朐辛寨镇怎么走?麻烦详细点,凯 ... 济南到临朐沂山高速路费多少钱 在聊天时 我说在洗衣服么 哥哥回 勤快呢妹子,我么到处闲 该怎么回复... 现在联通无线上网卡都需要实名制吗?其特点有哪些? ...a,b,c,d排成2行、2列,两边各加一条竖直线记成 . a c b d . ,定... ...a,b,c,d排成2行、2列,两边各加一条竖直线记成 . a b c d . ,定... ...上网卡终端,然后去联通营业厅办理业务(没有联通手机号),然后就行... 8月份联通上网卡有优惠吗?