SSブログ

売上のクロスセクション分析 [データサイエンス、統計モデル]

目的変数がya, ybの2つあるとします。
また、それぞれの説明変数がxa, xa、
さらに共通の説明変数としてxabを考えます。

この時、線形回帰モデルとして
ya = ba0 + ba1*xa + bab*xab + εa (式1)
yb = bb0 + bb1*xb + bab*xab + εb (式2)

共通の説明変数がない場合、
ya = ba0 + ba1*xa + εa (式1')
yb = bb0 + bb1*xb + εb (式2')

話は簡単で、(式1')と(式2')を別々に解けば良いのですが、共通の説明変数が入っているのでややこしい。
つまり、同時にパラメータを推定する必要があります。

この場合どうするかといえば、

目的変数 → Y
yaとybをユニオン結合して縦に結合する(1列)

説明変数 → X
1:(式1)の切片項
xa:(式1)の説明変数
xab:(式1)と(式2)の共通の説明変数
1:(式2)の切片項
xb(式2)の説明変数
を作る。

Rで推定する場合、
lm(Y ~ X-1)
もしくは、lm(Y ~ X+0)とする
-1, 0の意味は、切片項目がなしのモデルという意味です。

仮に、lm(Y ~ X) としてしまうと、b_newという別の切片項が出てきてしまいます。
Y = ba0 + ba1*xa + bab*xab + bb0 + bb1*xb + bab*xab + b_new

lm(Y ~ X-1)、もしくは、lm(Y ~ X+0)だと
Y = ba0 + ba1*xa + bab*xab + bb0 + bb1*xb + bab*xab
というモデルになり、(式1)と(式2)を同時に推定することができますね。

nice!(3)  コメント(0) 
共通テーマ:学問

nice! 3

コメント 0