SSブログ

Welchのt検定 [データサイエンス、統計モデル]

統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。

【質問】
t検定で等分散とは何ですか?

【回答】
先日、t検定を解説していたときに、ぽろっと等分散という言葉を使ったのですが、知らない人がけっこう多かったです。

少し前は、等分散かどうかを検定して、その後、t検定をするという流れでした。
最近では、多重検定の観点から、いきなり等分散を仮定しないt検定をするという方が良いだろうということになっています。

では、rでどうすればいいか?

A.sales <- c(1000, 980, 1200, 1260, 1500, 1005, 820, 1490, 1500, 960)
B.sales <- c(880, 1080, 1580, 2180, 1900, 1950, 1200, 910, 2100, 1890)
t.test(A.sales, B.sales)

デフォルトでは、等分散を仮定しない結果になります。

# t分散を仮定する場合
t.test(A.sales, B.sales, var.equal=T)

# t分散を仮定しない場合(Welchのt検定)
t.test(A.sales, B.sales, var.equal=F)

というオプションを付けます。

nice!(4)  コメント(0) 
共通テーマ:学問

nice! 4

コメント 0