SSブログ

エクセルで分散を計算、VAR.SとVAR.Pの違い [データサイエンス、統計モデル]

統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。

【質問】
エクセルの関数で分散を計算するとき、VAR.SとVAR.Pの違いがわかりません。

【回答】
VAR.S:不偏分散
VAR.P:標本分散

データ数が多い場合は、どっちを使ってもほとんど同じ結果になります。

不偏分散を使い場合
抽出したデータの分散に興味があるのではなく、その背後にある母集団の分散に興味がある場合です。
例えば、センター試験の点数の分散を計算するときに、受験生を10人ランダムに抽出して分散を計算しました。
10人の分散はあくまでも抽出した人の分散なので、母集団の分散を推定するためには少し補正が必要です。
このような場合にVAR.S:不偏分散を使います。

標本分散を使う場合
学校で身長や体重の分散を計算したい。
子供全員のデータを使って分散を計算します。
この場合、背後にあるなんらかの母集団を仮定しているわけではなく、標本そのものの分散に興味あります。
この場合にVAR.P:標本分散を使います。

nice!(4)  コメント(0) 
共通テーマ:学問

nice! 4

コメント 0