SSブログ

平均値の差の検定~サンプルサイズが大きい場合 [データサイエンス、統計モデル]

統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。

【質問】
下記の問題は、どう解けばいいか?

20代(300人)の購入額の平均:15000円, 標準偏差5000円
30代(400人)の購入額の平均:12000円, 標準偏差4000円

【回答】
この手の問題(平均値の差の検定)の場合、よくt検定を使って解きます。
サンプルサイズが小さい場合(通常だと10とか20くらいのサンプルサイズ)は、t検定を使うのですが、サンプルサイズが大きい場合(目安として100程度)は、z検定を使うことになります。

z検定ってあまり聞きなれない言葉かもしれませんが、要は標準正規分布に持ち込んで検定をすることができます。

帰無仮説H0:差がない
対立仮設H1:差がある



今回の問題だと、検定統計量zは、8.54となります。
α=0.05で両側検定をするので、
z(α/2)=z(0.025)=1.96

今回、8.54は、1.96に比べて、かなり大きい数字となっています。

つまり、違いがないと仮定した場合(帰無仮説H0)、そのような値が出る確率はかなり低く、対立仮設H1を採択します。
つまり、平均値の差は違いがあると考えた方が良いとなります。

nice!(0)  コメント(0) 
共通テーマ:学問