統計検定:2017年11月 問15について [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
2017年11月 問15の問題を母比率の差の検定を使ったが、やり方が正しいか?
【回答】
似ていますが、母比率の差の検定を使うのではなく、適合度検定を使うのが正しい方法となります。
母比率の差の検定を使う方法
> A.B.res <- c(5, 12, 33)
> A.B.pop <- c(20, 30, 50)
> prop.test(A.B.res, A.B.pop)
母比率の差の検定ですが、
20人中5人(25%)、30人中12人(40%)、33人中50人(50%)とした時、
25%, 40%, 50%は同じ確率か?ということを検定しています。
検定結果は、
3-sample test for equality of proportions without continuity correction
data: A.B.res out of A.B.pop
X-squared = 11.32, df = 2, p-value = 0.003483
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3
0.25 0.40 0.66
となっています。
p値が0.05よりも小さいので同じ比率ではないという結果になります。
一方、統計検定2級の過去問 2017年11月 問15ですが、
50人がくじを引いた時、
1等5人(理論値10人)、2等12人(理論値15人)、ハズレ33人(理論値25人)
となっており、
理論値の比率と比べて、
5人⇄10人(理論値:0.2)
12人⇄15人(理論値:0.3)
33人⇄25人(理論値:0.5)
同じような比率になっているか?を検定しています。
こちらは、適合度検定と呼ばれています。
> chisq.test(c(5, 12, 33), p = c(0.2, 0.3, 0.5))
Chi-squared test for given probabilities
data: c(5, 12, 33)
X-squared = 5.66, df = 2, p-value = 0.05901
この時の結果の読み方ですが、
検定統計量(カイ二乗値)は、5.66となります。
自由度は(3-1)x(2-1)=2です。
p値は、0.05901となり、一般的な0.05基準だとわずかに大きいため
帰無仮説は棄却されません。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
2017年11月 問15の問題を母比率の差の検定を使ったが、やり方が正しいか?
【回答】
似ていますが、母比率の差の検定を使うのではなく、適合度検定を使うのが正しい方法となります。
母比率の差の検定を使う方法
> A.B.res <- c(5, 12, 33)
> A.B.pop <- c(20, 30, 50)
> prop.test(A.B.res, A.B.pop)
母比率の差の検定ですが、
20人中5人(25%)、30人中12人(40%)、33人中50人(50%)とした時、
25%, 40%, 50%は同じ確率か?ということを検定しています。
検定結果は、
3-sample test for equality of proportions without continuity correction
data: A.B.res out of A.B.pop
X-squared = 11.32, df = 2, p-value = 0.003483
alternative hypothesis: two.sided
sample estimates:
prop 1 prop 2 prop 3
0.25 0.40 0.66
となっています。
p値が0.05よりも小さいので同じ比率ではないという結果になります。
一方、統計検定2級の過去問 2017年11月 問15ですが、
50人がくじを引いた時、
1等5人(理論値10人)、2等12人(理論値15人)、ハズレ33人(理論値25人)
となっており、
理論値の比率と比べて、
5人⇄10人(理論値:0.2)
12人⇄15人(理論値:0.3)
33人⇄25人(理論値:0.5)
同じような比率になっているか?を検定しています。
こちらは、適合度検定と呼ばれています。
> chisq.test(c(5, 12, 33), p = c(0.2, 0.3, 0.5))
Chi-squared test for given probabilities
data: c(5, 12, 33)
X-squared = 5.66, df = 2, p-value = 0.05901
この時の結果の読み方ですが、
検定統計量(カイ二乗値)は、5.66となります。
自由度は(3-1)x(2-1)=2です。
p値は、0.05901となり、一般的な0.05基準だとわずかに大きいため
帰無仮説は棄却されません。