SSブログ

正規分布かどうかの検定 [データサイエンス、統計モデル]

色々な検定方法がありますが、ややこしいのは、微妙に似ている分布だと
同じデータであるにも関わらず、検定結果が採択になる場合があったり、
棄却される場合があったりしてしまいます。

適合度の検定--正規分布への適合度の検定
http://aoki2.si.gunma-u.ac.jp/lecture/GoodnessOfFitness/normaldist.html

上記以外の方法としては、Rのパッケージ tseries に含まれているJarque-Bera Test(ジャック・ベラ検定)などもあります。

library(tseries)
dat <- read.table("data.csv", header=T)

jarque.bera.test(dat)

## Jarque Bera Test
##
## data: data
## X-squared = 30.881, df = 2, p-value = 1.969e-07

上記の場合は、p値が 1.969e-07 なので、有意水準 5% だったとすると、
帰無仮説は棄却されることになります。