普通の回帰ではなく、階層ベイズを使う利点 [階層ベイズ]
階層ベイズで変数が多くなると、計算時間が多くなってしまうので、
なんとか変数選択できないか?と考えました。
例えば、
1. まず、最初に、通常の回帰を行い、有意でないパラメータをみつける
2. 有意な変数のみ、階層ベイズの変数として使用する
というのは、どうかと思いました。
自分の先生に確認したところ、
『階層ベイズは、個人ごとのパラメータを推定できるのが利点。
つまり、普通の回帰(平均的にみれば)では、有意でないかもしれないけど、
ごく少数の人には有効な変数を発見できる。
』
とのことでした。
なるほど、、、
階層ベイズで、個人の異質性を表現することができますが、それは、普通の回帰分析では有意な変数でもある人にとって見れば有意でないし、
また、その逆で、有意でない変数もある人にとって見れば、すごく効いてくる変数かもしれない。
個人ごとのβのパラメータのヒストグラムです。
図1:βの平均値は、-0.224
図1は、きれいな正規分布に近い形をしています。
よく見ると、個人ごとに幅はあり、プラスの効果になっている人もいれば、マイナスの効果になっている人もいます。
図2:βの平均値は、0.008
図2は、明らかに二つのタイプの人がいることが分かります。
プラスに効く人とマイナスに効く人。
そして、平均値は、ちょうど二つの谷の0.008となっています。
通常の回帰分析では、このβの効果は、0.008と判断してしまうところですが、
実際は、0.008という平均の値を持っている人は、ほとんどいなくて、
よりマイナスか、よりプラスかのどちらか極端の値を持っている人だけとなります。
なんとか変数選択できないか?と考えました。
例えば、
1. まず、最初に、通常の回帰を行い、有意でないパラメータをみつける
2. 有意な変数のみ、階層ベイズの変数として使用する
というのは、どうかと思いました。
自分の先生に確認したところ、
『階層ベイズは、個人ごとのパラメータを推定できるのが利点。
つまり、普通の回帰(平均的にみれば)では、有意でないかもしれないけど、
ごく少数の人には有効な変数を発見できる。
』
とのことでした。
なるほど、、、
階層ベイズで、個人の異質性を表現することができますが、それは、普通の回帰分析では有意な変数でもある人にとって見れば有意でないし、
また、その逆で、有意でない変数もある人にとって見れば、すごく効いてくる変数かもしれない。
個人ごとのβのパラメータのヒストグラムです。
図1:βの平均値は、-0.224
図1は、きれいな正規分布に近い形をしています。
よく見ると、個人ごとに幅はあり、プラスの効果になっている人もいれば、マイナスの効果になっている人もいます。
図2:βの平均値は、0.008
図2は、明らかに二つのタイプの人がいることが分かります。
プラスに効く人とマイナスに効く人。
そして、平均値は、ちょうど二つの谷の0.008となっています。
通常の回帰分析では、このβの効果は、0.008と判断してしまうところですが、
実際は、0.008という平均の値を持っている人は、ほとんどいなくて、
よりマイナスか、よりプラスかのどちらか極端の値を持っている人だけとなります。
コメント 0