SSブログ

フィッシャーの世界と現実の問題 [データサイエンス、統計モデル]

フィッシャーは確かに天才であったが、恵まれていた環境であったことも確か。
そのことに気がついていたのか、気がついていなかったのかは知らない。

ただ、彼が作ったのは、結果には誤差がある(yに誤差がある)が、原因には誤差がない(xには誤差がない)環境で作り上げた統計。
つまり、自分がすべて制御できる環境下でのデータで作れらたのが古典的な統計。

有名な回帰式は
y = β0 + β1*x + … + βn*x +ε, ε~N(0, σ)

以下と同等である。
y ~ N(β0 + β1*x + … + βn*x, σ)

実際の世界では(マーケティングでは)、結果だけでなく原因にも誤差があるが、x軸とy軸が同等ではなく、全て、y軸に誤差という責任を負わせている。

p値とか、信頼区間は、本当は、マーケティングにおいては、ものすっごく相性が悪い理論だと思う。

にもかかわらず、これだけABテストとか検定が流行っているのは、とりあえずp値が低かったらOKといったある種の信仰的なものではないだろうか。

nice!(3)  コメント(0) 
共通テーマ:学問

nice! 3

コメント 0