SSブログ

ベイズ統計量におけるパラメーターの推定 [ベイズ統計量におけるパラメーターの推定]

ベイズ統計量におけるパラメーターの推定

昔のパワーポイントを整理してたら、「ベイズ統計量におけるパラメーターの推定」なるものが出てきた。
こんなことを考えていたんだなぁと、しみじみ。

昔、↓のブログを見たことがある。
(y+1)/(n+2) instead of y/n
http://www.stat.columbia.edu/~cook/movabletype/archives/2007/05/y1n2_instead_of.html

ざっと、要約すると、ある確率を求めるときに、例えば、レスポンス率などを求めるときに、
100人に送って、30人が反応したとすると、
30 / 100 = 0.300
と考えるよりも、
31 / 102 = 0.303...
と推定するという話。

なんで、y/n ではなく、 (y+1)/(n+2) なのか?
これは、2項分布の Posterior Mean が (y+α)/(n+α+β)で、α=1, β=1 した値である。
α=1, β=1が何を表しているかといえば、事前分布(ベータ分布)が一様分布であることを表している。

もう少し詳しく書くと、ベータ分布のpの期待値は
(Prior Mean)
Prior Mean

(Posterior Mean)
Posterior Mean

となって、上の式から得られたベイズ統計量は
ベイズ統計量

となる。

事前分布と事後分布が同じベータ分布となっているご利益は、また別の機会にでも。


nice!(0) 
共通テーマ:学問

nice! 0