試行回数nが小さい場合の二項分布の検定 [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【例題】
試行回数が多くなると正規分布に近似して検定を行うことができますが、試行回数が小さい場合は直接確率計算をすることができます。
原理原則を理解するという意味では、試行回数が小さい場合を理解してから、正規分布に近似するやり方を覚えるのが良いかもしれません。
新しく開発された技術を用いた実験を行なった。
試行回数nが20回のうち、x=16回成功したとする。
新技術は過去の成功率p=0.6に比べて改善されたか?
【解答】
帰無仮説 H0:p=0.6
対立仮説 H1:p>0.6
に対して検定を行う。
p値の計算
16回の時の確率値+17回の時の確率値++18回の時の確率値+19回の時の確率値+20回の時の確率値
# Rで計算する場合
# 成功確率が16回の確率値
dbinom(16,20,0.6)
0.03499079
# 成功確率が17回の確率値
dbinom(17,20,0.6)
0.01234969
# 以下、省略
# 16回、17回、18回、19回、20回正解する確率の合計値を求める
dbinom(16,20,0.6)+dbinom(17,20,0.6)+dbinom(18,20,0.6)+dbinom(19,20,0.6)+dbinom(20,20,0.6)
# シンプルに書くならこちら
sum(dbinom(c(16:20), 20, 0.6))
# 答え
0.05095195
この結果は5%よりわずかに大きく、有意にならない。
~参考までに~
試行回数nが大きい場合の二項分布の検定
https://skellington.blog.so-net.ne.jp/2019-04-05
せっかくなので、その中からピックアップして紹介できればと思います。
【例題】
試行回数が多くなると正規分布に近似して検定を行うことができますが、試行回数が小さい場合は直接確率計算をすることができます。
原理原則を理解するという意味では、試行回数が小さい場合を理解してから、正規分布に近似するやり方を覚えるのが良いかもしれません。
新しく開発された技術を用いた実験を行なった。
試行回数nが20回のうち、x=16回成功したとする。
新技術は過去の成功率p=0.6に比べて改善されたか?
【解答】
帰無仮説 H0:p=0.6
対立仮説 H1:p>0.6
に対して検定を行う。
p値の計算
16回の時の確率値+17回の時の確率値++18回の時の確率値+19回の時の確率値+20回の時の確率値
# Rで計算する場合
# 成功確率が16回の確率値
dbinom(16,20,0.6)
0.03499079
# 成功確率が17回の確率値
dbinom(17,20,0.6)
0.01234969
# 以下、省略
# 16回、17回、18回、19回、20回正解する確率の合計値を求める
dbinom(16,20,0.6)+dbinom(17,20,0.6)+dbinom(18,20,0.6)+dbinom(19,20,0.6)+dbinom(20,20,0.6)
# シンプルに書くならこちら
sum(dbinom(c(16:20), 20, 0.6))
# 答え
0.05095195
この結果は5%よりわずかに大きく、有意にならない。
~参考までに~
試行回数nが大きい場合の二項分布の検定
https://skellington.blog.so-net.ne.jp/2019-04-05