SSブログ

無限母集団における無相関検定について [データサイエンス、統計モデル]

無相関検定とは、二つの変数の相関係数を計算した時に、その相関係数に意味があるのかを調べる検定です。

検定の流れですが、まず、帰無仮説と対立仮説を仮定します。
帰無仮説「母集団の相関係数が0である。母相関係数ρ=0」
対立仮説「母集団の相関係数は0でない。母相関係数ρ≠0」

母集団から標本を取り出し、二つの変数の相関係数を計算し、その信頼区間を計算します。
少しややこしいのですが、標本の相関係数 r の分布は ρ=0のとき、自由度 n - 2のt分布に従います。

n-1 ではなく、n-2に注意が必要です。
なぜ、自由度がn-2かですが、二つの変数を使っているので、それぞれの平均値を計算しています。
そのため、自由度が2つ減ります。

さて、相関係数の信頼区間を計算するのだが、こちらは無作為抽出をやり直すたび信頼区間は変動します。
母相関係数ρの値は固定されており、確率的に変化するのはこの r の信頼区間です。

標本を何度も抽出すると、rの信頼区間の幅や位置が変わり、その形の区間がρを含む確率が95%になるという意味しています。

この区間が0を含んでいる場合、母相関係数が0ということを否定できないから、帰無仮説を採択します。
間違えやすいのは、母相関係数が0であるとは言っていないことです。
(実際に二つの変数の相関係数が0ということは滅多に起こりえないことだと思います。)

nice!(14)  コメント(0)  トラックバック(0) 
共通テーマ:学問