多変量解析:多重ロジスティック回帰分析 [データサイエンス、統計モデル]
IBM SPSS「医療統計:多変量解析」講座の続き。
ロジスティック回帰の推薦書らしい。
以下、講座の備忘録。
---------- 重回帰分析 ----------
・多重ロジスティック回帰分析
手順
1. データは正規分布か?
正規分布か否かは問題としない
2. 名義尺度の変数は存在するか?
3. 多重共線性は存在するか?
r > 0.9 以上は、一方を削除
4. 2変量解析を行い、変数間の関係を探る
最近では、t検定などは行わず、いきなりロジスティック回帰を行う
昔は、有意になりそうなものを候補に入れて計算していた
5. 重回帰、判別分析で独立変数を絞る
6. 多重ロジスティック回帰分析を行う
尤度比を使う(Waldは使わない)
有意確率は、有意である必要はない。
1つ1つの変数が有意かどうかは関係なく、モデル自体が有意かどうかが大切
1つ1つが有意かどうかを選ぶのは、wald 検定を選ぶ
しかし、wald 検定で変数を選ぶのは良くないといわれている
Hosmer-Lemeshow 検定
p ≧ 0.05 なら適合が良い
判別分類表
70%以上の的中率が良い(経験的な意見で根拠がない)
1986年スペースシャトルの打ち上げにロジスティック回帰が使われている
前日に、落ちる確率は分かっていたが、NASAは打ち上げてしまった
オッズ比を100乗する場合は、信頼区間も100乗すれば良い
β 母集団の回帰係数
1.0以上と1.0以下の場合、逆数をとって影響度の強さを比較する
----------------------------------------
ロジスティック回帰の推薦書らしい。
以下、講座の備忘録。
---------- 重回帰分析 ----------
・多重ロジスティック回帰分析
手順
1. データは正規分布か?
正規分布か否かは問題としない
2. 名義尺度の変数は存在するか?
3. 多重共線性は存在するか?
r > 0.9 以上は、一方を削除
4. 2変量解析を行い、変数間の関係を探る
最近では、t検定などは行わず、いきなりロジスティック回帰を行う
昔は、有意になりそうなものを候補に入れて計算していた
5. 重回帰、判別分析で独立変数を絞る
6. 多重ロジスティック回帰分析を行う
尤度比を使う(Waldは使わない)
有意確率は、有意である必要はない。
1つ1つの変数が有意かどうかは関係なく、モデル自体が有意かどうかが大切
1つ1つが有意かどうかを選ぶのは、wald 検定を選ぶ
しかし、wald 検定で変数を選ぶのは良くないといわれている
Hosmer-Lemeshow 検定
p ≧ 0.05 なら適合が良い
判別分類表
70%以上の的中率が良い(経験的な意見で根拠がない)
1986年スペースシャトルの打ち上げにロジスティック回帰が使われている
前日に、落ちる確率は分かっていたが、NASAは打ち上げてしまった
オッズ比を100乗する場合は、信頼区間も100乗すれば良い
β 母集団の回帰係数
1.0以上と1.0以下の場合、逆数をとって影響度の強さを比較する
----------------------------------------
コメント 0