平均値の差の検定~サンプルサイズが小さい場合(非等分散の場合) [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
下記の問題は、どう解けばいいか?
20代(30人)の購入額の平均:15000円, 標準偏差5000円
30代(40人)の購入額の平均:12000円, 標準偏差3000円
【回答】
t検定で等分散を仮定できない場合は、ウェルチのt検定を使います。
まずは、等分散の検定から。
検定統計量Tは、2.778
F値1.961より検定統計量Tが大きいので、H0が棄却され、2つの母分散は異なると考えます。
つまり、非等分散となり、ウェルチのt検定を使います。
以下、ウェルチのt検定の進め方。
帰無仮説H0:差がない
対立仮設H1:差がある
検定統計量は、2.916
自由度は32.13となります。
t(32.13, 0.025) = 2.036
※ Rだと、qt(0.975, 32.13)で計算できます。
つまり、T=2.916 > 2.036なので、H0を棄却し、H1を採択します。
この場合は、差があると考えます。
■ 関連するページ
平均値の差の検定~サンプルサイズが大きい場合
https://skellington.blog.ss-blog.jp/
平均値の差の検定~サンプルサイズが小さい場合(等分散の場合)
https://skellington.blog.ss-blog.jp/2020-07-30
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
下記の問題は、どう解けばいいか?
20代(30人)の購入額の平均:15000円, 標準偏差5000円
30代(40人)の購入額の平均:12000円, 標準偏差3000円
【回答】
t検定で等分散を仮定できない場合は、ウェルチのt検定を使います。
まずは、等分散の検定から。
検定統計量Tは、2.778
F値1.961より検定統計量Tが大きいので、H0が棄却され、2つの母分散は異なると考えます。
つまり、非等分散となり、ウェルチのt検定を使います。
以下、ウェルチのt検定の進め方。
帰無仮説H0:差がない
対立仮設H1:差がある
検定統計量は、2.916
自由度は32.13となります。
t(32.13, 0.025) = 2.036
※ Rだと、qt(0.975, 32.13)で計算できます。
つまり、T=2.916 > 2.036なので、H0を棄却し、H1を採択します。
この場合は、差があると考えます。
■ 関連するページ
平均値の差の検定~サンプルサイズが大きい場合
https://skellington.blog.ss-blog.jp/
平均値の差の検定~サンプルサイズが小さい場合(等分散の場合)
https://skellington.blog.ss-blog.jp/2020-07-30
コメント 0