问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

Python数据可视化 箱线图

发布网友 发布时间:2022-04-22 02:29

我来回答

1个回答

热心网友 时间:2022-04-06 15:17

Python数据可视化:箱线图
一、箱线图概念
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。
计算过程:

(1)计算上四分位数(Q3),中位数,下四分位数(Q1)
(2)计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)Q3-Q1
(3)绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数的位置绘制横线。
(4)大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers)。
(5)异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的触须。
(6)极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍-3倍四分位数差之间的异常值,用空心点表示。
(7)为箱线图添加名称,数轴等

二、四分位数的计算

分位数根据其将数列等分的形式不同可以分为中位数,四分位数,十分位数、百分位数等等。四分位数作为分位数的一种形式,在统计中有着十分重要的意义和作用,而大多数的统计学原理教材只介绍其基本含义,对其具体计算,尤其是由组距数列计算都不作介绍,成为统计学原理教材中的空白。那么,如何根据数列计算四分位数呢?一般来讲,视资料是否分组而定。

1、根据未分组的资料计算四分位数

第一步:确定四分位数的位置

四分位数是将数列等分成四个部分的数,一个数列有三个四分位数,设下分位数、中分位数和上分位式中n表示资料的项数

第二步:根据第一步所确定的四分位数的位置,确定其相应的四分位数。
例1:某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4、15.7公斤,则三个四分位数的位置分别为:

即变量数列中的第三个、第六个、第九个工人的某种产品产量分别为下四分位数、中位 数和上四分位数。即:
Q1 =13.8公斤、Q2=14.6公斤、Q3=15.2公斤
上例中(n+1)恰好为4的倍数,所以确定四分数较简单,如果(n+1)不为4的整数倍数,按上述分式计算出来的四分位数位置就带有小数,这时,有关的四分位数就应该是与该小数相邻的两个整数位置上的标志值的平均数,权数的大小取决于两个整数位置距离的远近,距离越近,权数越大,距离越远,权数越小,权数之和等于1。
例2:某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,则三个四分位数的位置分别为:

即变量数列中的第2.75项、第5.5项、第8.25项工人的某种产品产量分别为下四分位 数、中位数和上四分位数。即:

在实际资料中,由于标志值序列中的相邻标志值往往是相同的,因而不一定要通过计算才能得到有关的四分位数。

2、由组距式数列确定四分位数

第一步,向上或向下累计次数.
第二步,根据累计次数确定四分位数的位置.
(1)、当采用向上累计次数的资料确定四分位数时,四分位数位置的公式是:

(2)、当采用向下累计次数的资料确定四分位数时,四分位数位置的公式是:

第三步,根据四分位数的位置算出各四分位数.
(1)、当累计次数是向上累计时,按下限公式计算各四分位数.

(2)、当累计次数是向下累计时,按上限公式计算各四分位数.

例3:某企业职工按月工资的分组资料如下:

根据上述资料确定某企业职工的月工资的三个四分位数如下:
(1)、采用向上累计职工人数的资料得月工资四分位数的位置为:
(2)、采用向下累计职工人数的资料得月工资四分位数的位置为:

3、异常值

异常值:*线以外的数据全部为异常值
三、画图

# Python
import plotly.plotly
import plotly.graph_objs as go

data = [
go.Box(
y=[0, 1, 1, 2, 3, 5, 8, 13, 21] # 9个数据
)
]
plotly.offline.plot(data) # 离线绘图
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
你见过最古老的东西是什么,有多少年历史 WORD中怎么输出稿纸模式word中怎么输出稿纸模式 女性尿检阴性是什么意思 阴性尿检是什么意思 尿检阴性是什么 win10如何查看电脑配置参数 win10怎样查看电脑配置参数 多地对公职人员提接种要求 亚马逊订单可以退回任何Kohl's商店,7月份生效 亚马逊提供免费退货,珠宝退货卖家要承担运费吗 新的亚马逊退货政策惹争议!官方解答来了 如何使用python数据特征分析与可视化 每股收益 0.0836 这样的股票算好吗? python爬出来的数据怎么进行可视化 选购的股票,市盈率越低,越能赚钱吗? Python做数据可视化不如R吗 衡量股票:每股收益和净资产收益率那个更重要 《Python数据可视化编程实战》txt下载在线阅读全文... python 怎样数据可视化 3d 买股票最需要关注哪些财务指标? 每股盈利最高的股票是哪个?每股盈利越高越好吗? Python基础知识学习之如何实现数据可视化 股票每股收益是不是每股分红多少钱 每股收益和分红有关系嘛? python数据可视化有什么用 股票每股收益是什么意思?和分红有关系吗。 为何每股收益如此重要? Python中数据可视化的两个库! 大家买股票 很看重每股收益么? Python中数据可视化经典库有哪些? 每股盈利和每股收益有什么区别?每股收益不好的股... python大数据可视化有哪些用途 基于Python的成绩数据可视化分析 需要转LPR吗?请大神指导! 房产抵押贷款要不要转lpr? 首套房贷是6·37该转Lpr吗? 美图2死机了怎么强制重启?急等???? 17年房贷,利率5.1,现在要不要转换LPR? 房贷利率5.635%贷款47万15年等额本金还款要不要转L... 房屋贷款几年银行的利率要不要转换? 房贷利率5.98%贷30年,现在要不要转LPR呢? 美图手机冲不进去电怎么回事 美图手机卡机自拍键的小孔用针怎么插进去 美图手机掉地板开不了机怎么回事 美图手机自拍键的小孔怎么用针插进去? 被单什么面料好 全棉和涤棉的区别是什么 求主角女扮男装的玄幻小说推荐 女扮男装的穿越玄幻小说 求 女扮男装、玄幻、女强,像傲风一样的小说 装成纨绔子弟 女扮男装的玄幻小说