问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

计算机视觉创企Roboflow:自动驾驶汽车训练语料库遗漏关键数据

发布网友 发布时间:2022-04-26 20:56

我来回答

1个回答

热心网友 时间:2023-11-01 08:41

Roboflow拥有一个备受欢迎的语料库 - Udacity数据集2,主要用于训练自动驾驶汽车模型,不过,最近该公司表示该数据集缺少了关键数据。

盖世汽车讯 机器学习模型的性能取决于其训练的数据集的质量,而在自动驾驶领域,让此种性能不会受到失误的影响是至关重要的。据外媒报道,计算机视觉初创公司Roboflow发布了一份报告,据该公司创始人Brad Dwyer所说,用于训练自动驾驶汽车模型的语料库确实遗漏了关键数据。

Dwyer表示,Udacity数据集2包含1.5万张白天在山景城和附近城市开车时拍摄的照片,其中就遗漏了关键数据。在大约5000个样本中,有数千辆未标记的车辆,数百名未标记的行人以及数十名未标记的骑自行车的车,占总数的33%(而217个样本中根本都没有任何注释,此类样本涵盖了汽车、卡车、路灯或行人)。更糟糕的是,还有“幻觉”注释以及除了“严重”加大的边界框(边界框指代感兴趣的对象),还有重复注释的边界框。

考虑到标签是让人工智能(AI)系统理解模式的含义(如有人走到了汽车前面),并基于此类知识评估未来事件,上述现象是很有问题的。错误标记或未标记的物体可能会导致准确性低、决策糟糕,从而为自动驾驶汽车带来灾难。

AI很容易因为数据集不完整或不正确导致偏差,这很好理解。例如,单词嵌入(word embedding)是一种常见的算法训练技术,需要将单词与向量连接起来的,不可避免地会捕捉到源文本和对话中隐含的偏见内容,在最糟糕的情况下,此种偏见还会被放大。此外,相比于白人,很多面部识别系统错误识别有色人种的次数更多,而且谷歌图片(Google Photos)曾经将深肤色的人识别为“大猩猩。”

但是,如果将表现不佳的AI用于汽车,就会造成更大的伤害。目前,还没有自动驾驶汽车引发碰撞事故的记录,但是目前公共道路上的自动驾驶汽车数量很少。不过,这种情况很可能会改变,根据市场营销公司ABI的数据,到2025年,将有多达800万辆无人驾驶汽车上路;而Research and Markets公司预计,到2030年,美国将有大约2000万辆无人驾驶汽车投入使用。

如果数百万的汽车运行的是有缺陷的AI模型,带来的影响可能是毁灭性的,会让公众更加不信任无人驾驶汽车。有两项研究 – 一项由布鲁金斯学会(Brookings Institution)和一项由高速公路与汽车安全倡议者(AHAS)表示,大多数美国人并不相信无人驾驶汽车的安全性。在布鲁金斯学会进行的调查中,超过60%的受访者表示,倾向于不乘坐自动驾驶汽车;而在AHAS的调查中,近70%的受访者对于与自动驾驶汽车共享道路表示了担忧。

解决数据集问题的方法可能在于更好地进行标记。根据Udacity数据集2的GitHub页面所说,众包语料库注释公司Autti结合使用机器学习与人工监工的方式来处理标记,目前尚不清楚是否此种方法导致了上述错误,不过严格的验证程序可能有助于发现上述错误。(文中图片均来自venturebeat.com)

本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。

热心网友 时间:2023-11-01 08:41

Roboflow拥有一个备受欢迎的语料库 - Udacity数据集2,主要用于训练自动驾驶汽车模型,不过,最近该公司表示该数据集缺少了关键数据。

盖世汽车讯 机器学习模型的性能取决于其训练的数据集的质量,而在自动驾驶领域,让此种性能不会受到失误的影响是至关重要的。据外媒报道,计算机视觉初创公司Roboflow发布了一份报告,据该公司创始人Brad Dwyer所说,用于训练自动驾驶汽车模型的语料库确实遗漏了关键数据。

Dwyer表示,Udacity数据集2包含1.5万张白天在山景城和附近城市开车时拍摄的照片,其中就遗漏了关键数据。在大约5000个样本中,有数千辆未标记的车辆,数百名未标记的行人以及数十名未标记的骑自行车的车,占总数的33%(而217个样本中根本都没有任何注释,此类样本涵盖了汽车、卡车、路灯或行人)。更糟糕的是,还有“幻觉”注释以及除了“严重”加大的边界框(边界框指代感兴趣的对象),还有重复注释的边界框。

考虑到标签是让人工智能(AI)系统理解模式的含义(如有人走到了汽车前面),并基于此类知识评估未来事件,上述现象是很有问题的。错误标记或未标记的物体可能会导致准确性低、决策糟糕,从而为自动驾驶汽车带来灾难。

AI很容易因为数据集不完整或不正确导致偏差,这很好理解。例如,单词嵌入(word embedding)是一种常见的算法训练技术,需要将单词与向量连接起来的,不可避免地会捕捉到源文本和对话中隐含的偏见内容,在最糟糕的情况下,此种偏见还会被放大。此外,相比于白人,很多面部识别系统错误识别有色人种的次数更多,而且谷歌图片(Google Photos)曾经将深肤色的人识别为“大猩猩。”

但是,如果将表现不佳的AI用于汽车,就会造成更大的伤害。目前,还没有自动驾驶汽车引发碰撞事故的记录,但是目前公共道路上的自动驾驶汽车数量很少。不过,这种情况很可能会改变,根据市场营销公司ABI的数据,到2025年,将有多达800万辆无人驾驶汽车上路;而Research and Markets公司预计,到2030年,美国将有大约2000万辆无人驾驶汽车投入使用。

如果数百万的汽车运行的是有缺陷的AI模型,带来的影响可能是毁灭性的,会让公众更加不信任无人驾驶汽车。有两项研究 – 一项由布鲁金斯学会(Brookings Institution)和一项由高速公路与汽车安全倡议者(AHAS)表示,大多数美国人并不相信无人驾驶汽车的安全性。在布鲁金斯学会进行的调查中,超过60%的受访者表示,倾向于不乘坐自动驾驶汽车;而在AHAS的调查中,近70%的受访者对于与自动驾驶汽车共享道路表示了担忧。

解决数据集问题的方法可能在于更好地进行标记。根据Udacity数据集2的GitHub页面所说,众包语料库注释公司Autti结合使用机器学习与人工监工的方式来处理标记,目前尚不清楚是否此种方法导致了上述错误,不过严格的验证程序可能有助于发现上述错误。(文中图片均来自venturebeat.com)

本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
莲花冬天发芽好吗 过冬荷花什么时候发芽 一个手机号怎样登陆两个孩子的长沙市中小学生人人通云平台 人人通怎么进入学校 人人通电脑版学生怎样登录 名侦探柯南真人版3为什么要换人? 真人版柯南,你最喜欢小栗旬还是沟端淳平? 央企中国稀土集团落户江西,衷心希望江西摆脱“环江西经济带”地位_百度... 来天津的央企有哪些 东丽区的央企有哪些 北方汽车教具研发中心的无人驾驶模型车都有什么功能? 睡觉的时候夹炖肉味做梦奇臭无比是什么意思? 梦见毛坑里炖肉 周公解梦梦见瓦罐炖肉有人买走变成黄子? 梦见去世的亲人准备炖肉,让我去买调料? 梦见大火炖肉沸腾往里添水? 梦见炖的莽肉 m.sosuo.name 梦见去世母亲梦炖肉炖了两块肉还有妹妹也烧肉,在后来Jtl亲就做褥子说是给我弟弟做的,在后来我就哭醒 我梦见回家吃炖肉,这表示什么意思啊? 梦见去世的妈妈给我做的土豆炖肉好香 梦见炒菜炖肉 女大学生扫二维码被骗近万是什么情况? 企业上市需要具备什么条件? 今天在电影院碰到一个女的一直在那边兜兜转转 一脸骗子样 硬让我加她微信 让我扫了她的二维 男的女的微信二维码带在身上,让顾客扫码,啥意思1-2十元,天天你收到 被扫描微信个人二维码会有风险吗 出去玩,有个陌生年轻女的扫我的微 搭讪女生要微信,她让我扫了二维码却不知道什么原因好多天我这边一直没通知,再次见她还要不要打招呼? 公司上市的基本条件是什么? “有码女”身上的二维码是她们的吗? 上市公司基本拿几样条件? 中国天才少女,设计出磁悬浮汽车,为什么拒绝千万美金坚决带回祖国 ? 牛肉虾仁馅配什么蔬菜 水下车辆和无人驾驶,到底哪个能够最先商业化? 学校想给汽修专业成立一个智能驾驶网联汽车实训室,从哪采购相关的汽车教学设备? 怎样使用微信编辑器 欣赏精致的途昂X车模魅力的车身外观! 牛肉虾仁白菜馅的做法 真正的无人驾驶汽车离我们还太远 拍模型发帖,蓝鸟独秀,城市风的拍摄 作文未来的汽车怎么写 汽车哪些高科技配置最贴心? 随着互联网巨头进军汽车行业,国内哪些车企将会面临困境? 乐骋汽车科技(上海)有限公司怎么样? 汽车智能化发展迅速,而智能化配置实用性是真的吗? 深圳墨菲航空科技有限公司怎么样? 听说中北教具基地的教学设备是自己生产的,中职类院校合作可用的汽修专业交钥匙工程,流程是怎样的? 德系车除了BBA之外,还有哪些畅销的品牌呢? 智能网联发展前景如何? 高三历史 罗斯福新政 罗斯福新政要记的知识点!初三历史老师进