问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

f-measure的准确率/精确率/召回率

发布网友 发布时间:2022-05-17 20:44

我来回答

1个回答

热心网友 时间:2023-11-07 07:06

准确率(accuracy),精确率(Precision)和召回率(Recall) 是信息检索,人工智能,和搜索引擎的设计中很重要的几个概念和指标。中文中这几个评价指标翻译各有不同,所以一般情况下推荐使用英文。 先假定一个具体场景作为例子。
假如某个班级有男生80人,女生20人,共计100人.目标是找出所有女生.  某人挑选出50个人,其中20人是女生,另外还错误的把30个男生也当作女生挑选出来了.  作为评估者的你需要来评估(evaluation)下他的工作
首先我们可以计算准确率(accuracy),其定义是: 对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。也就是损失函数是0-1损失时测试数据集上的准确率 .
这样说听起来有点抽象,简单说就是,前面的场景中,实际情况是那个班级有男的和女的两类,某人(也就是定义中所说的分类器)他又把班级中的人分为男女两类。accuracy需要得到的是此君分正确的人占总人数的比例。很容易,我们可以得到:他把其中70(20女+50男)人判定正确了,而总人数是100人,所以它的accuracy就是70 %(70 / 100).
由准确率,我们的确可以在一些场合,从某种意义上得到一个分类器是否有效,但它并不总是能有效的评价一个分类器的工作。举个例子,google抓取了argcv 100个页面,而它索引*有10,000,000个页面,随机抽一个页面,分类下,这是不是argcv的页面呢?如果以accuracy来判断我的工作,那我会把所有的页面都判断为不是argcv的页面,因为我这样效率非常高(return false,一句话),而accuracy已经到了99.999%(9,999,900/10,000,000),完爆其它很多分类器辛辛苦苦算的值,而我这个算法显然不是需求期待的,那怎么解决呢?这就是precision,recall和f1-measure出场的时间了.
在说precision,recall和f1-measure之前,我们需要先需要定义TP,FN,FP,TN四种分类情况.
按照前面例子,我们需要从一个班级中的人中寻找所有女生,如果把这个任务当成一个分类器的话,那么女生就是我们需要的,而男生不是,所以我们称女生为正类,而男生为负类. 相关(Relevant),正类无关(NonRelevant),负类被检索到(Retrieved)true positives(TP 正类判定为正类,例子中就是正确的判定这位是女生)false positives(FP 负类判定为正类,存伪,例子中就是分明是男生却判断为女生,当下伪娘横行,这个错常有人犯)未被检索到(Not Retrieved)false negatives(FN 正类判定为负类,去真,例子中就是,分明是女生,这哥们却判断为男生--梁山伯同学犯的错就是这个)true negatives(TN 负类判定为负类,也就是一个男生被判断为男生,像我这样的纯爷们一准儿就会在此处)通过这张表,我们可以很容易得到例子中这几个分类的值:TP=20,FP=30,FN=0,TN=50.
精确率(precision)的公式是 ,它计算的是所有被检索到的item(TP+FP)中,应该被检索到的item(TP)”占的比例。
在例子中就是希望知道此君得到的所有人中,正确的人(也就是女生)占有的比例.所以其precision也就是40%(20女生/(20女生+30误判为女生的男生)).
召回率(recall)的公式是 ,它计算的是所有检索到的item(TP)占所有应该被检索到的item(TP+FN)的比例。
在例子中就是希望知道此君得到的女生占本班中所有女生的比例,所以其recall也就是100%(20女生/(20女生+ 0 误判为男生的女生))
前文中提到F1-measure的计算公式是 其推导其实也很简单。
定义:
,定义为和的调和平均数。
可得:
“精确率”与“召回率”虽然没有必然的关系(从上面公式中可以看到),然而在大规模数据集合中,这两个指标却是相互制约的。
由于“检索策略”并不完美,希望更多相关的文档被检索到时,放宽“检索策略”时,往往也会伴随出现一些不相关的结果,从而使准确率受到影响。
而希望去除检索结果中的不相关文档时,务必要将“检索策略”定的更加严格,这样也会使有一些相关的文档不再能被检索到,从而使召回率受到影响。
凡是涉及到大规模数据集合的检索和选取,都涉及到“召回率”和“精确率”这两个指标。而由于两个指标相互制约,我们通常也会根据需要为“检索策略”选择一个合适的度,不能太严格也不能太松,寻求在召回率和精确率中间的一个平衡点。这个平衡点由具体需求决定。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
白色T 恤如何搭配才能穿出优雅的韵味? 白色T 恤衫怎样搭配才能显得时髦又好看? 白色紧身正肩T 恤想要穿出休闲感,该如何搭配? 手机怎么连接笔记本电脑的wifi上网 电热水器为什么用着用着就没压力了 用什么拖地最干净又耐脏 爱奇艺会员的等级是怎么划分的? 爱奇艺星钻会员怎么开通 怎样才是正确的接吻呢 网页上鼠标点住右键拖动后出的蓝色线条是什么?干什么用的?为什么一松开... 概率问题当p(a并b)=p(a)+p(b)=1时,A与B的关系是什么 这个式子P(a并b)拔怎么算 高数填空题以知pa等于0.3,pb等于0.4,pab等于0.2,则p a并b等于多少 两事件相互独立,那么P(A并B)等于P(A)加P(B)吗?求解释 电脑能上网手机显示无互联网连接 用电脑开wifi突然显示无互联网连接 地球诞生于哪一年 地球诞生了几年? 地球是在距今多少年形成的? 地球诞生多少年叻? 为什么在篮球世锦赛上中国的英文是P.R.OF CHINA 中华人民共和国的英文缩写P.R.China的P后面是否需要空一格再加一点呢? P.R.CHINA和R.P.CHINA哪个写法对? 为什么使用p.r.china c语言,char *p; p="china",p是“china的”首地址,那如果写成p='c' ,此时的p代表什么呢? P.R.China 和 P.R. of China 哪个正确? 求徐梦圆china-p和china-x,谢谢 关于小说的名字,帮忙想想 文学由来 唐传奇是如何兴起与发展的? 绝密公式算单双准确率99? 牙膏和白醋可以去除羽绒服袖部的污渍吗? 苹果 6 Plus,在中国移动信号强的情况下打电话总是掉线是什么原因? 苹果6 plus手机打电话经常无缘无故的挂断,还提示呼叫失败怎么办? 苹果6手机老是无服务,打电话老是自动挂断。请问各位这是手机问题还是信号问题 谢谢 眉山一中好还是眉山外国语学校好 彭山县最好的高中 孩子今年中考,想去眉山读高中。请问眉山一中和眉山中学到底哪个好? 彭山的高中有哪些啊? 彭州一中和彭山一中是一样的吗 彭山一中2016年哪个班好、 彭山有哪些中学 QQ邮箱超大附件存在草稿箱里是永久的吗 2016年彭山彭祖山在打造吗 彭山一中王碧林是谁 怎么表示自己工作很忙但是又不想透露的那么明显 求杜甫很忙的一系列图片 求杜甫很忙这几张图片的原图 凭借款的平台有哪些 requests 怎么调用js代码