ベイズ統計量におけるパラメーターの推定 [ベイズ統計量におけるパラメーターの推定]
ベイズ統計量におけるパラメーターの推定
昔のパワーポイントを整理してたら、「ベイズ統計量におけるパラメーターの推定」なるものが出てきた。
こんなことを考えていたんだなぁと、しみじみ。
昔、↓のブログを見たことがある。
(y+1)/(n+2) instead of y/n
http://www.stat.columbia.edu/~cook/movabletype/archives/2007/05/y1n2_instead_of.html
ざっと、要約すると、ある確率を求めるときに、例えば、レスポンス率などを求めるときに、
100人に送って、30人が反応したとすると、
30 / 100 = 0.300
と考えるよりも、
31 / 102 = 0.303...
と推定するという話。
なんで、y/n ではなく、 (y+1)/(n+2) なのか?
これは、2項分布の Posterior Mean が (y+α)/(n+α+β)で、α=1, β=1 した値である。
α=1, β=1が何を表しているかといえば、事前分布(ベータ分布)が一様分布であることを表している。
もう少し詳しく書くと、ベータ分布のpの期待値は
(Prior Mean)
(Posterior Mean)
となって、上の式から得られたベイズ統計量は
となる。
事前分布と事後分布が同じベータ分布となっているご利益は、また別の機会にでも。