SSブログ

マルチコは悪か? [データサイエンス、統計モデル]

xとyの相関はプラスなのに、重回帰になると逆のマイナスになる場合があります。

例えば、広告効果の場合、ある施策を行ったときに、基本はプラスになるはずだけど、
重回帰の偏回帰係数がマイナスになってしまうという例。

重回帰の原理原則を理解していると、「まぁ、そうだよね。」という場合が結構ありますが、マーケティングの立場からすると、その結果だとまずい場合があります。

ただ、本来なら、なぜマイナスになってしまうのかという理由はきちんと説明できるのですが、なかなかその原理を理解しないまま、悩んでしまう人は多そうですね。

昔、書いたブログのエントリー
 
重回帰で回帰係数の符号が逆転している場合の意味
http://skellington.blog.so-net.ne.jp/2017-05-17


話はそれましたが、マルチコ(多重共線性)が起こると何がまずくて、どうすれば良いのか?
逆に、まずくない部分は何か?をまとめました。

多重共線性が起こっている場合の現象
1. 係数の標準誤差が大きくなる
 各係数のt値が小さくなり、係数が優位になりにくくなる
 係数が理論から予想される値と大きくかい離することがある
2. 個別係数のt値が小さいにも関わらず、決定係数が大きくなる
3. データのわずから変動や観測期間の変更で係数が多く変化する

3.の現象は有名だと思いますが、1.と2.は意外と知らない人が多い気がします。

多重共線性の間違った対応
以下は、巷で流れている間違った対応なので、ご注意を!
1. 説明変数を減らす
2. X1, X2ではなく、変数変換でX1 - X2とX2を回帰する
3. 階差を取る
4. データ数を減らす

1.をやっている人が多い気がしますが、
本来必要な説明変数を減らすことは、過小定式化につながり、推定に偏りが生じてしまいます。

多重共線性の対処法
・データ数を増やす
・モデルについての追加的情報を使う
 β1+β2=1など

Y(目的変数)の推定精度
多重共線性が起こっていると、Yの推定値の精度が悪くなる気がするが、悪くなることはない。

nice!(1)  コメント(0) 
共通テーマ:学問

nice! 1

コメント 0