68–95–99.7法則
在統計上,68–95–99.7法則(68–95–99.7 rule)是在正態分佈中,距平均值小於一個標準差、二個標準差、三個標準差以內的百分比,更精確的數字是68.27%、95.45%及99.73%。若用數學用語表示,其算式如下,其中X為常態分布隨機變數的觀測值,μ為分佈的平均值,而σ為標準差:
在實驗科學中有對應正態分佈的三西格馬法則(three-sigma rule of thumb),是一個簡單的推論,內容是「幾乎所有」的值都在平均值正負三個標準差的範圍內,也就是在實驗上可以將99.7%的機率視為「幾乎一定」[1]。不過上述推論是否有效,會視探討領域中「顯著」的定義而定,在不同領域,「顯著」(significant)的定義也隨著不同,例如在社會科學中,若置信区间是在正負二個標準差(95%)的範圍,即可視為顯著。但是在粒子物理中,若是發現(英语:Discovery (observation))新的粒子,置信区间要到正負五個標準差(99.99994%)的程度。
在不是正態分佈的情形下,也有另一個對應的三西格馬法則(three-sigma rule),即使是在非正態分佈的情形下,至少會有88.8%的機率會在正負三個標準差的範圍內,這是依照切比雪夫不等式的結果。若是單模分佈(unimodal distributions)下,正負三個標準差內的機率至少有95%,若一些符合特定條件的分佈,機率至少會到98%[2] 。
數值表
由于正态分布含有指数项的特性,超出某个标准差范围的概率会随着该范围的扩大而大幅减小。假如某实验每天进行一次,则实验结果超出某标准差范围的频率可列为下表:
範圍 | 預期的样本比例在範圍內 | 近似預期頻率超出範圍 | 近似頻率(假设每天实验一次) |
---|---|---|---|
μ ± 0.5σ | 0.382924922548026 | 3次中发生2次 | 每星期四至五次 |
μ ± σ | 0.682689492137086[3] | 3次中发生1次 | 每星期兩次 |
μ ± 1.5σ | 0.866385597462284 | 7次中发生1次 | 每星期 |
μ ± 2σ | 0.954499736103642[4] | 22次中发生1次 | 每三個星期 |
μ ± 2.5σ | 0.987580669348448 | 81次中发生1次 | 每三个月 |
μ ± 3σ | 0.997300203936740[5] | 370次中发生1次 | 每年 |
μ ± 3.5σ | 0.999534741841929 | 2 149次中发生1次 | 每六年 |
μ ± 4σ | 0.999936657516334 | 15 787次中发生1次 | 每43 年(约一生两次) |
μ ± 4.5σ | 0.999993204653751 | 7005147160000000000♠147160次中发生1次 | 每403 年(近代以来仅1次) |
μ ± 5σ | 0.999999426696856 | 7006174427800000000♠1744278次中发生1次 | 每7003477600000000000♠4776年(人类记录历史以来仅1次) |
μ ± 5.5σ | 0.999999962020875 | 7007263302540000000♠26330254次中发生1次 | 每7004720900000000000♠72090年(智人出现以来仅4次) |
μ ± 6σ | 0.999999998026825 | 7008506797346000000♠506797346次中发生1次 | 每138萬年(直立人出现以来仅1-2次) |
μ ± 6.5σ | 0.999999999919680 | 7010124501973930000♠12450197393次中发生1次 | 每3400萬年(恐龙灭绝以来仅2次) |
μ ± 7σ | 0.999999999997440 | 7011390682215445000♠390682215445次中发生1次 | 每10.7億年(地球诞生以来仅4次) |
μ ± xσ | 次中发生1次 | 每天 |
参考文献
- ^ 「三西格馬法則」的用法大約是在公元2000年代時出現,有刊載在Schaum's Outline of Business Statistics. McGraw Hill Professional. 2003: 359 及Grafarend, Erik W. Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. 2006: 553. 上
- ^ See:
- Wheeler, D. J.; Chambers, D. S. Understanding Statistical Process Control. SPC Press. 1992.
- Czitrom, Veronica; Spagon, Patrick D. Statistical Case Studies for Industrial Process Improvement. SIAM. 1997: 342.
- Pukelsheim, F. The Three Sigma Rule. American Statistician. 1994, 48: 88–91.
- ^ Sloane, N.J.A. (编). Sequence A178647. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation.
- ^ Sloane, N.J.A. (编). Sequence A110894. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation.
- ^ Sloane, N.J.A. (编). Sequence A270712. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation.
参见
- 查
- 论
- 编
概率分布(列表(英语:List of probability distributions))
有限支集 | |
---|---|
無限支集 |
|
紧支集 |
|
---|---|
半無限區間支集 |
|
无限区间支集 |
|
可变类型支集 |
|
連續離散 |
|
---|
- Discrete:
- Ewens(英语:Ewens's sampling formula)
- multinomial(英语:multinomial distribution)
- Dirichlet(英语:Dirichlet-multinomial distribution)
- negative(英语:negative multinomial distribution)
- Continuous:
- 狄利克雷分布
- generalized(英语:Generalized Dirichlet distribution)
- multivariate Laplace(英语:Multivariate Laplace distribution)
- 多元正态分布
- multivariate stable(英语:Multivariate stable distribution)
- multivariate t(英语:Multivariate t-distribution)
- normal-gamma(英语:normal-gamma distribution)
- inverse(英语:Normal-inverse-gamma distribution)
- 随机矩阵
- LKJ(英语:Lewandowski-Kurowicka-Joe distribution)
- 矩阵正态分布
- matrix t(英语:matrix t-distribution)
- matrix gamma(英语:matrix gamma distribution)
- inverse matrix gamma(英语:inverse matrix gamma distribution)
- 威沙特分佈
- normal(英语:normal-Wishart distribution)
- 逆威沙特分佈
- normal-inverse(英语:normal-inverse-Wishart distribution)
- 循環單變量定向統計(英语:Directional statistics)
- 圆均匀分布
- univariate von Mises(英语:von Mises distribution)
- wrapped normal(英语:Wrapped normal distribution)
- wrapped Cauchy(英语:Wrapped Cauchy distribution)
- wrapped exponential(英语:Wrapped exponential distribution)
- wrapped asymmetric Laplace(英语:Wrapped asymmetric Laplace distribution)
- wrapped Lévy(英语:Wrapped Lévy distribution)
- 球形雙變量
- Kent(英语:Kent distribution)
- 環形雙變量
- bivariate von Mises(英语:bivariate von Mises distribution)
- 多變量
- von Mises–Fisher(英语:Von Mises–Fisher distribution)
- Bingham(英语:Bingham distribution)
- Circular(英语:Circular distribution)
- 复合泊松分布
- elliptical(英语:Elliptical distribution)
- exponential(英语:Exponential family)
- natural exponential(英语:Natural exponential family)
- location–scale(英语:location–scale family)
- Maximum entropy(英语:Maximum entropy probability distribution)
- Mixture(英语:Mixture distribution)
- Pearson(英语:Pearson distribution)
- Tweedie(英语:Tweedie distribution)
- Wrapped(英语:Wrapped distribution)
- 分类
- 维基共享