我上一封通報說合成的機率分布不是高斯分布而是t-distribution,這句話得詳細說明。高斯分布的convolution還是高斯分布,為什麼平均值的分布可以不是高斯分布呢?這是因為我們所謂的高斯分布是指原始分布的標準差已知的情況。但是事實上我們手上只有樣本的標準差,沒有原始分布的標準差,原始分布的標準差只有上帝知道。我們只好拿樣本的標準差來估計原始分布的標準差。

 

如果N很大,這個估計就很可靠,兩者相差根號N除以根號(N-1),樣本標準差比原始分布的標準差略小。但是如果N小,那麼樣本標準差自己也會隨不同樣本而變,也就是每次取樣都得到不同的樣本標準差,所以得考慮樣本標準差自己的機率分布。這個分布叫做chi-square distribution。把這個因素考慮進去,平均值的機率分布以樣本標準差來表達,就變成t-distribution