发布网友 发布时间:2022-03-23 11:41
共1个回答
热心网友 时间:2022-03-23 13:10
分别表示样本数据中的极端值。
箱图中在最上方和最下方的星号和圆圈分别表示样本数据中的极端值。一般有两种类型的箱图:单式箱图用于分析只有一个变量的数据分布,复式箱图用以分析具有两个或以上变量的数据分布。
箱图的极端值
指大于三倍四分位数间距的数值。在箱式图中常用实心圆表示。
箱式图是一个重要的探索性数据分析工具来决定是否一个因子有重要影响在变量或位置的反应中。可观察数据呈正态分布、左偏分布、右偏分布还是其他类型的分布,如U型分布。
极端值属于异常值的一种,又称离群值(outlier),如果不作特别要求,异常值和极端值均用一个点单独表示。
首先找出一组数据的五个特征值,包括除异常值外的最小值(minimum)和最大值(maximum)、中位数(median)、两个四分位数(上四分位数Q1和下四分位Q3数)。
中位数:将所有数值从小到大排列,如果是奇数个数值则取最中间一个值作为中位数,之后最中间的值在计算Q1和Q3时不再使用;偶数个数值则取最中间两个数的平均数作为中位数,这两个数在计算Q1和Q3时继续使用。