統計手法から統計モデリングへ その2 熱伝搬モデル [データサイエンス、統計モデル]
y = a + b * x
という単回帰分析を考えた場合、パラメータa, bは分散共分散行列から計算することができます。
a = (yの平均) - σxy/σxx * (xの平均)
b = σxy/σxx
下記のような問題を考えた場合、
式1:y = a1 + b1 * x
式2:x = a2 + b2 * y
⇒ y = -a2/b2 + 1/b2 * x
回帰直線の変数xとyを入替えた場合の傾きは、一致しません。
つまり、因果の方向性を知っている場合に、
式1:(原因)= a + b * (結果)
式2:(結果)= a + b * (原因)
式2を考えた方が自然な発想になります。
ここで炉内温度、炉外温度の話に戻して、、、
炉内温度:Y [通常は、測定できない]
↓(熱伝搬)
炉外温度:X1 [測定可能]
↓(熱伝搬)
炉外温度:X2 [測定可能]
Yは炉内の真の温度で測定できない ⇒ 潜在変数
X1, X2は、観測変数となります。
因子分析や、パス解析、共分散構造分析を使ってモデリングをするのが次のステップとなります。
という単回帰分析を考えた場合、パラメータa, bは分散共分散行列から計算することができます。
a = (yの平均) - σxy/σxx * (xの平均)
b = σxy/σxx
下記のような問題を考えた場合、
式1:y = a1 + b1 * x
式2:x = a2 + b2 * y
⇒ y = -a2/b2 + 1/b2 * x
回帰直線の変数xとyを入替えた場合の傾きは、一致しません。
つまり、因果の方向性を知っている場合に、
式1:(原因)= a + b * (結果)
式2:(結果)= a + b * (原因)
式2を考えた方が自然な発想になります。
ここで炉内温度、炉外温度の話に戻して、、、
炉内温度:Y [通常は、測定できない]
↓(熱伝搬)
炉外温度:X1 [測定可能]
↓(熱伝搬)
炉外温度:X2 [測定可能]
Yは炉内の真の温度で測定できない ⇒ 潜在変数
X1, X2は、観測変数となります。
因子分析や、パス解析、共分散構造分析を使ってモデリングをするのが次のステップとなります。
コメント 0