SSブログ

ポアソン検定:ポアソンのλを検定したい [データサイエンス、統計モデル]

購入割合(1 or 0)の検定は、prop.testを使うことができますし、
体重や身長といった量的データの検定は、t.testを使うことができます。

今回は、少し特殊なポアソン検定について。

身長や体重といった連続量ではなく、0, 1, 2といった回数データ(カウントデータ、そしてその数はそれほど多くない)に対してどういった検定を行えば良いか?

ぱっと思いつくのは、ポアソン分布に従っているので、そのλ(平均値)が二つのグループで異なるかどうかを検定したい、となります。

まず、ポアソン分布はパラメータがλしかありません。
平均も分散もλという強い縛りがあるので、実データでなかなか再現することはなかなかないです。
実際は分散が平均よりもはるかに大きな過分散状態になっている場合が多いのではないでしょうか。

かりに、平均も分散もそれなりに等しいデータだったとして以下ポアソン検定についての説明をしていきます。

TG1:ターゲットグループの成功回数
CG1:コントロールグループの成功回数
TG2:ターゲットグループの試行回数
CG2:コントロールグループの試行回数
とします。

つまり、10人いて、一人が複数回、購入し合計30回の購入があったとします。
この時、TG1=30, TG2=10となります。

# ポアソン検定
poisson.test(c(TG1, CG1), c(TG1, CG1), alternative = "greater", conf.level = 0.95)

alternativeのオプションは、両側検定("two.sided")か片側検定("less", "greater")となります。
何も指定しない場合、デフォルトは、両側検定。
conf.levelは信頼区間を設定できます。

nice!(1)  コメント(0) 
共通テーマ:学問