SSブログ

統計手法から統計モデリングへ その1 因果推論のモデリング [データサイエンス、統計モデル]

統計手法から統計モデリングへ
https://www.jstage.jst.go.jp/article/rssj1981/18/1/18_1_57/_pdf

椿先生がよく講義で使われる元ネタ

こちらを自分なりに色々試して理解しました。

考え方はこんな感じ。

炉内温度:Y [通常は、測定できない]
↓(熱伝搬)
炉外温度:X1 [測定可能]
↓(熱伝搬)
炉外温度:X2 [測定可能]



このようなデータがあった時に、Yの温度をX1とX2を使って、どう推定するか?という問題になります。

そこで、
Y = a1 * X1 + a2 * X2 + a0
という重回帰分析を使って、モデル化しようというのが最初の第一歩。

結果は、
Y = 1.214 * X1 - 0.001 * X2 + 10.8
となるのですが、X2の係数は有意でなく、再度
Y = a1 * X1 + a0
というモデルを考え、パラメータを推定します。

その結果は、
Y = 1.213 * X1 + 10.8
となります。

そこで、Yの予測結果(炉内温度)は、上の式で与えられると考えるのですが、このモデルのおかしいところは、X1やX2が決まれば、Yが決まるという構造を表していることです。

本来は、Yが決まってX1やX2が決まるので、原因と結果が逆転していることになります。

nice!(1)  コメント(0)  トラックバック(0) 
共通テーマ:学問

nice! 1

コメント 0

トラックバック 0