売上のクロスセクション分析 [データサイエンス、統計モデル]
目的変数がya, ybの2つあるとします。
また、それぞれの説明変数がxa, xa、
さらに共通の説明変数としてxabを考えます。
この時、線形回帰モデルとして
ya = ba0 + ba1*xa + bab*xab + εa (式1)
yb = bb0 + bb1*xb + bab*xab + εb (式2)
共通の説明変数がない場合、
ya = ba0 + ba1*xa + εa (式1')
yb = bb0 + bb1*xb + εb (式2')
話は簡単で、(式1')と(式2')を別々に解けば良いのですが、共通の説明変数が入っているのでややこしい。
つまり、同時にパラメータを推定する必要があります。
この場合どうするかといえば、
目的変数 → Y
yaとybをユニオン結合して縦に結合する(1列)
説明変数 → X
1:(式1)の切片項
xa:(式1)の説明変数
xab:(式1)と(式2)の共通の説明変数
1:(式2)の切片項
xb(式2)の説明変数
を作る。
Rで推定する場合、
lm(Y ~ X-1)
もしくは、lm(Y ~ X+0)とする
-1, 0の意味は、切片項目がなしのモデルという意味です。
仮に、lm(Y ~ X) としてしまうと、b_newという別の切片項が出てきてしまいます。
Y = ba0 + ba1*xa + bab*xab + bb0 + bb1*xb + bab*xab + b_new
lm(Y ~ X-1)、もしくは、lm(Y ~ X+0)だと
Y = ba0 + ba1*xa + bab*xab + bb0 + bb1*xb + bab*xab
というモデルになり、(式1)と(式2)を同時に推定することができますね。
また、それぞれの説明変数がxa, xa、
さらに共通の説明変数としてxabを考えます。
この時、線形回帰モデルとして
ya = ba0 + ba1*xa + bab*xab + εa (式1)
yb = bb0 + bb1*xb + bab*xab + εb (式2)
共通の説明変数がない場合、
ya = ba0 + ba1*xa + εa (式1')
yb = bb0 + bb1*xb + εb (式2')
話は簡単で、(式1')と(式2')を別々に解けば良いのですが、共通の説明変数が入っているのでややこしい。
つまり、同時にパラメータを推定する必要があります。
この場合どうするかといえば、
目的変数 → Y
yaとybをユニオン結合して縦に結合する(1列)
説明変数 → X
1:(式1)の切片項
xa:(式1)の説明変数
xab:(式1)と(式2)の共通の説明変数
1:(式2)の切片項
xb(式2)の説明変数
を作る。
Rで推定する場合、
lm(Y ~ X-1)
もしくは、lm(Y ~ X+0)とする
-1, 0の意味は、切片項目がなしのモデルという意味です。
仮に、lm(Y ~ X) としてしまうと、b_newという別の切片項が出てきてしまいます。
Y = ba0 + ba1*xa + bab*xab + bb0 + bb1*xb + bab*xab + b_new
lm(Y ~ X-1)、もしくは、lm(Y ~ X+0)だと
Y = ba0 + ba1*xa + bab*xab + bb0 + bb1*xb + bab*xab
というモデルになり、(式1)と(式2)を同時に推定することができますね。
コメント 0