SSブログ

決定係数がマイナスになる場合とは? [データサイエンス、統計モデル]

回帰分析を実行すると、決定係数R2が0から1の間で表示されます。
R2と書くくらいなので、二乗というのが頭に残り、マイナスの値なんて取らない!と思ってしまう人も多い。

(実際に、自分もそう思っていましたw)

ただ、ゼロ点回帰(回帰分析で切片がなく、原点を通る回帰分析)を行ったら、決定係数がマイナスになる場合が数学的に証明されます。

ゼロ点回帰は、説明変数が0の場合、必ず目的変数も0となる場合、切片項は0のはずなので、最初から0にしてしまう回帰です。
実際のところ、データには揺らぎがあって、理論的には回帰係数は0であっても、計算で求めた切片は、0.001みたいに限りなく0に近いけど、0でないケースがほとんどです。
実際に、誤差を計算すると、0にしてしまう方が誤差は大きくなってしまいます。

で、話を戻すと、決定係数は、R2=Sr/Syyで計算できます。
Sr=Syy-Se
なのですが、対象データに対してゼロ点回帰のあてはまりが悪い場合、
Syy < Seとなる場合があります。
つまり、Sr<0となり、R2=Sr/Syy < 0になってしまうのが理由です。

nice!(3)  コメント(0) 
共通テーマ:学問

nice! 3

コメント 0