Welchのt検定 [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
t検定で等分散とは何ですか?
【回答】
先日、t検定を解説していたときに、ぽろっと等分散という言葉を使ったのですが、知らない人がけっこう多かったです。
少し前は、等分散かどうかを検定して、その後、t検定をするという流れでした。
最近では、多重検定の観点から、いきなり等分散を仮定しないt検定をするという方が良いだろうということになっています。
では、rでどうすればいいか?
A.sales <- c(1000, 980, 1200, 1260, 1500, 1005, 820, 1490, 1500, 960)
B.sales <- c(880, 1080, 1580, 2180, 1900, 1950, 1200, 910, 2100, 1890)
t.test(A.sales, B.sales)
↑
デフォルトでは、等分散を仮定しない結果になります。
# t分散を仮定する場合
t.test(A.sales, B.sales, var.equal=T)
# t分散を仮定しない場合(Welchのt検定)
t.test(A.sales, B.sales, var.equal=F)
というオプションを付けます。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
t検定で等分散とは何ですか?
【回答】
先日、t検定を解説していたときに、ぽろっと等分散という言葉を使ったのですが、知らない人がけっこう多かったです。
少し前は、等分散かどうかを検定して、その後、t検定をするという流れでした。
最近では、多重検定の観点から、いきなり等分散を仮定しないt検定をするという方が良いだろうということになっています。
では、rでどうすればいいか?
A.sales <- c(1000, 980, 1200, 1260, 1500, 1005, 820, 1490, 1500, 960)
B.sales <- c(880, 1080, 1580, 2180, 1900, 1950, 1200, 910, 2100, 1890)
t.test(A.sales, B.sales)
↑
デフォルトでは、等分散を仮定しない結果になります。
# t分散を仮定する場合
t.test(A.sales, B.sales, var.equal=T)
# t分散を仮定しない場合(Welchのt検定)
t.test(A.sales, B.sales, var.equal=F)
というオプションを付けます。
コメント 0