売上のクロスセクション分析：Minkyのよもやま日記：SSブログ

	ブログをはじめるログイン

売上のクロスセクション分析　[データサイエンス、統計モデル] [編集]

目的変数がya, ybの2つあるとします。
また、それぞれの説明変数がxa, xa、
さらに共通の説明変数としてxabを考えます。

この時、線形回帰モデルとして
ya = ba0 + ba1*xa + bab*xab + εa　（式1）
yb = bb0 + bb1*xb + bab*xab + εb　（式2）

共通の説明変数がない場合、
ya = ba0 + ba1*xa + εa　（式1'）
yb = bb0 + bb1*xb + εb　（式2'）

話は簡単で、（式1'）と（式2'）を別々に解けば良いのですが、共通の説明変数が入っているのでややこしい。
つまり、同時にパラメータを推定する必要があります。

この場合どうするかといえば、

目的変数 → Y
yaとybをユニオン結合して縦に結合する（1列）

説明変数 → X
1：（式1）の切片項
xa：（式1）の説明変数
xab：（式1）と（式2）の共通の説明変数
1：（式2）の切片項
xb（式2）の説明変数
を作る。

Rで推定する場合、
lm(Y ~ X-1)
もしくは、lm(Y ~ X+0)とする
-1, 0の意味は、切片項目がなしのモデルという意味です。

仮に、lm(Y ~ X) としてしまうと、b_newという別の切片項が出てきてしまいます。
Y = ba0 + ba1*xa + bab*xab + bb0 + bb1*xb + bab*xab + b_new

lm(Y ~ X-1)、もしくは、lm(Y ~ X+0)だと
Y = ba0 + ba1*xa + bab*xab + bb0 + bb1*xb + bab*xab
というモデルになり、（式1）と（式2）を同時に推定することができますね。

2020-07-16 23:59 nice!(3) コメント(0)
共通テーマ：学問