ICS03.120.30 A41 GB 中华人民共和国国家标准 GB/T6380—2019 代替GB/T6380—2008 数据的统计处理和解释 型极值分布样本离群值的判断和处理 Statistical interpretation of data-Detection and treatment of outliers in the sample from type I extreme value distribution 2019-12-10发布 2020-07-01实施 国家市场监督管理总局 国家标准化管理委员会 发布 GB/T6380—2019 目 次 前言 l 引言 Ⅱ 1范围 2规范性引用文件 1 3术语、定义和符号 1 3.1术语和定义1 3.2符号 3 4离群值判断 3 4.1离群值的来源与判定3 4.2检出离群值个数的上限 3 4.3单个离群值情形 3 4.4多个离群值情形 4 5离群值处理 4 5.1处理方式 .4 5.2处理规则 4 5.3备案 4 6单个离群值的判断规则 .4 6.1检验方法的选择4 6.2狄克逊(Dixon)检验法 4 6.3欧文(Irwin)检验法 .6 7多个离群值的判断规则7 7.1检验步骤 7 7.2多个离群值检验示例 .7 附录A(规范性附录)狄克逊检验的临界值表 附录B(规范性附录)欧文检验的临界值表 9 参考文献 10 71 GB/T6380—2019 前言 本标准按照GB/T1.1一2009给出的规则起草. 本标准代替GB/T6380一2008《数据的统计处理和解释I型极值分布样本异常值的判断和处 理》,与GB/T6380一2008相比,主要技术内容变化如下: ——修改了术语型极值分布(见3.1.1 2008年版的3.1.1); —修改了术语1型极小值分布(见3.1.2 2008年版的3.1.2); —修改了术语离群值(见3.1.3 2008年版的3.1.3); ——增加了次序统计量的定义及说明(见3.1.8); —修改了离群值的处理规则(见5.2 2008年版的5.2); 一增加了威布尔分布(Ⅲ型极小值分布)取对数后转化为型极小值分布的说明及离群值计算示 例(见6.2.3); —增加了参考文献ISO16269-4:2010(见参考文献). 本标准由全国统计方法应用标准化技术委员会(SAC/TC21)提出并归口. 本标准起草单位:天津大学、北京理工大学珠海学院、宁波工程学院. 本标准主要起草人:马逢时、许其州、史道济、荆广珠. 本标准所代替标准的历次版本发布情况为: —GB/T6380—1986、GB/T6380—2008. GB/T6380—2019 引言 从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不 开统计方法.统计学是研究数字资料的整理、分析和正确解释的一门学科.人们各自从不同的来源取 得各种数字资料,这些数字资料通常都是杂乱无章的,经过整理和简缩才能利用,使用完善的统计方法 就可使数据整理、排列得有条有理,用图形或少量的几个重要参数,就可将大量数据的特征表达出来,这 样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益. 根据收集到的样本观测值,可以大体上确认样本来自为某种分布.这时发现样本中的一个或几个 观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体.是否为实际的离群值,需要统计检 验.在离群值的检验中特别要注意数据来自哪一种基本分布,假定来自型极值分布与假定来自正态 分布在检验时是非常不同的,对分布的错误假定会导致观测值被错误地归类为离群值. 国家标准《数据的统计处理和解释》包含以下各项: —统计容忍区间的确定(GB/T3359); —均值的估计和置信区间(GB/T3360); 一在成对观测值情形下两个均值的比较(GB/T3361); 一二项分布参数的估计与检验(GB/T4088); 一泊松分布参数的估计与检验(GB/T4089); 一正态性检验(GB/T4882); 一正态样本离群值的判断和处理(GB/T4883); 一正态分布均值和方差的估计与检验(GB/T4889); 一正态分布均值和方差检验的功效(GB/T4890); 一I型极值分布样本离群...