一. 隨機誤差的正態(tài)分布
1. 正態(tài)分布
隨機誤差的規(guī)律服從正態(tài)分布規(guī)律,可用正態(tài)分布曲線(高斯分布的正態(tài)概率密度函數(shù))表示:
(13)
式中:y —概率密度; m—總體平均值;s —總體標(biāo)準(zhǔn)偏差。
正態(tài)分布曲線依賴于m 和s 兩個基本參數(shù),曲線隨m 和s 的不同而不同。為簡便起見,使用一個新變數(shù)(u)來表達誤差分布函數(shù)式:
(14)
u的涵義是:偏差值(x-m)以標(biāo)準(zhǔn)偏差為單位來表示。
變換后的函數(shù)式為:
(15)
由此繪制的曲線稱為“標(biāo)準(zhǔn)正態(tài)分布曲線” 。因為標(biāo)準(zhǔn)正態(tài)分布曲線橫坐標(biāo)是以s 為單位,所以對于不同的測定值 m 及s ,都是適用的。
圖1:兩組精密度不同的測定值 圖2:標(biāo)準(zhǔn)正態(tài)分布曲線
的正態(tài)分布曲線
“標(biāo)準(zhǔn)正態(tài)分布曲線”清楚地反映了隨機誤差的分布性質(zhì):
(1)集中趨勢 當(dāng) x=m 時(u=0),,y此時最大,說明測定值x集中在 m 附近,或者說,m 是最可信賴值。
(2)對稱趨勢 曲線以 x=m 這一直線為對稱軸,表明:
正負誤差出現(xiàn)的概率相等。大誤差出現(xiàn)的概率小,小誤差出現(xiàn)的概率大;很大誤差出現(xiàn)的概率極小。在無限多次測定時,誤差的算術(shù)平均值極限為 0 。
(3)總概率 曲線與橫坐標(biāo)從-µ 到 + µ 在之間所包圍的面積代表具有各種大小誤差的測定值出現(xiàn)的概率的總和,其值為1(100%)
(16)
用數(shù)理統(tǒng)計方法可以證明并求出測定值 x 出現(xiàn)在不同 u 區(qū)間的概率(不同 u 值時所占的面積)即 x 落在 m± us 區(qū)間的概率:
置信區(qū)間 置信概率
u = ± 1.00 x = m ± 1.00 s 68.3%
u = ± 1.96 x = m ± 1.96 s 95.0%
u = ± 3.00 x = m ± 3.00 s 99.7%
二. 有限數(shù)據(jù)隨機誤差的 t 分布
在實際測定中,測定次數(shù)是有限的,只有和S,此時則用能合理地處理少量實驗數(shù)據(jù)的方法—t 分布
1. t 分布曲線 (實際測定中,用 、S 代替m、s)
t 分布曲線與標(biāo)準(zhǔn)正態(tài)分布曲線相似,縱坐標(biāo)仍為概率密度,縱坐標(biāo)則是新的統(tǒng)計量t
(17)
無限次測定,u一定 ® P 就一定;
有限次測定:t 一定 ® P 隨 n (自由度)不同而不同。
不同的 n 值及概率所對應(yīng)的t值,已有統(tǒng)計學(xué)家計算出來,可由有關(guān)表中查出。
2. 平均值的置信區(qū)間
應(yīng)用t分布估計真值范圍,考慮的符號時,則可得到如下關(guān)系式:
m = x ± tP,n S (18)
同樣,對于樣本平均值也存在類似的關(guān)系式:
(19)
此式表示的是在一定概率下,以樣本平均值為中心的包括真值在內(nèi)的取值范圍,即平均值的置信區(qū)間。 稱為置信區(qū)間界限。
此式表明:平均值與真值的關(guān)系,即說明平均值的可靠性。
平均值的置信區(qū)間取決于測定的精密度、測定次數(shù)和置信水平(概率)。(分析工作中常規(guī)定為 95%)
測定精密度越高(S小),測定次數(shù)越多(n大),置信區(qū)間則越小,即平均值越準(zhǔn)確。