SSブログ

「不偏分散による標準偏差」と「不偏標準偏差」の違い [データサイエンス、統計モデル]

統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。

【質問】
「不偏分散による標準偏差」と「不偏標準偏差」は同じものですか?

【回答】
母分散 σ2 の平方根は、母標準偏差 σ 。

ここで、不偏分散を U2 として、「不偏分散による標準偏差(不偏分散の平方根)」 U は、なんとなく母標準偏差 σ の不偏推定量になっている気がするのですが、実は、不偏推定量にはなっていない。

このあたりの事を詳しくまとめているサイトがありました。

https://atarimae.biz/archives/8276

https://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE

https://en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviation

不偏分散 U2 の平方根を不偏標準偏差だと教える大学の先生も多いようです。

この辺りは、感覚的に同じ不偏推定量になっていると錯覚してしまうことが原因だと思います。

不偏分散の値を s2 とします。
s2は、母分散 σ2 の不偏推定量であるので
E(s2) = σ2・・・①
となっています。
(証明は略)

「不偏分散による標準偏差」sが、母標準偏差 σの不偏推定量というのは、
E(s) = σ・・・②
であることなのですが、これは数学的には間違い

①から両辺平方根を取って②が導出できるという錯覚に陥りがちなのですが、①の平方根は、

√(E(s2)) であり、(E(√s2))=E(s)ではないので、①が正しいからと言って、②が成り立つとは言えません。

nice!(0)  コメント(0) 
共通テーマ:学問