SSブログ

分散の計算式 [データサイエンス、統計モデル]

定義に従えば、「各データから平均値を引いた値を二乗して、その和をデータ数で割る。」となります。


一方、教科書によく書いている分散公式は、「まず、データを二乗し、その和をデータ数で割ってから、平均の二乗をひく。」というものです。


どうやら、生産管理とかで統計が流行った時代は、まだ、紙と鉛筆で計算をしていた時代でした。
そのため、計算の回数を減らすための公式なのですが、現在では、コンピュータや統計ソフトが普通に発達しているので、分散の公式を使わなくても、普通に定義通り計算しても問題ないし、むしろ、そちらの方がいい気がしますね。

nice!(3)  コメント(0) 
共通テーマ:日記・雑感

nice! 3

コメント 0