平均値の差の検定~サンプルサイズが小さい場合(等分散の場合) [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
下記の問題は、どう解けばいいか?
20代(30人)の購入額の平均:15000円, 標準偏差5000円
30代(40人)の購入額の平均:12000円, 標準偏差5000円
【回答】
前回の問題に似ているのですが、サンプルサイズが小さいので、z検定に持ち込むことができません。
そこで、サンプルサイズが小さい場合の検定としては、t検定を使うことになります。
t検定は、二種類あって、等分散の場合と、そうでない場合に分けられます。
今回は、等分散の場合。
帰無仮説H0:差がない
対立仮設H1:差がある
検定統計量は、2.48
自由度は(n1+n2-2)なので68となります。
t(68, 0.025) = 1.995
※ Rだと、qt(0.975, 68)で計算できます。
つまり、T=2.48 > 1.995なので、H0を棄却し、H1を採択します。
この場合は、差があると考えます。
■ 関連するページ
平均値の差の検定~サンプルサイズが大きい場合
https://skellington.blog.ss-blog.jp/
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
下記の問題は、どう解けばいいか?
20代(30人)の購入額の平均:15000円, 標準偏差5000円
30代(40人)の購入額の平均:12000円, 標準偏差5000円
【回答】
前回の問題に似ているのですが、サンプルサイズが小さいので、z検定に持ち込むことができません。
そこで、サンプルサイズが小さい場合の検定としては、t検定を使うことになります。
t検定は、二種類あって、等分散の場合と、そうでない場合に分けられます。
今回は、等分散の場合。
帰無仮説H0:差がない
対立仮設H1:差がある
検定統計量は、2.48
自由度は(n1+n2-2)なので68となります。
t(68, 0.025) = 1.995
※ Rだと、qt(0.975, 68)で計算できます。
つまり、T=2.48 > 1.995なので、H0を棄却し、H1を採択します。
この場合は、差があると考えます。
■ 関連するページ
平均値の差の検定~サンプルサイズが大きい場合
https://skellington.blog.ss-blog.jp/