ベイズ統計量におけるパラメーターの推定：Minkyのよもやま日記：SSブログ

	ブログをはじめるログイン

ベイズ統計量におけるパラメーターの推定ブログトップ

事前分布自体が未知の場合の Empirical Bayes Approach　[ベイズ統計量におけるパラメーターの推定]

事前分布自体が未知の場合の Empirical Bayes Approach

前回までだと、二項分布にしろ多項分布にしろ、 P の事前分布のパラメータは未知であるが、事前分布は、既知であると考えてきた。
では、事前分布が未知であるような場合、Empirical Bayes Approachは、どうなるであろうか？
↓
An Empirical Bayes Approach
事前分布自体が未知の場合、P をどのように推定するかを考える。

Binomial Kernelの場合、

ここで、r は、試行の数を表す固定された正の整数とし、また、X は成功の数とする。
X の事前分布は未知とする。

となる。

基本関係式は、

今、を推定する。

を考え、これは、n → ∞ で確率 1 でとなる。

今、r 回の試行中、初めの (r - 1)回の試行の中で、成功の数を表す確率変数列を考える。

を考えると、これは、n → ∞ で確率 1 でとなる。

ゆえに、

とおけば、これは、n → ∞ で確率 1 で

の推定値として、平均自乗誤差を考えるときに、シミュレーションで求めることができる値として、を取ることができる。

そして、これは、n → ∞ に関して

となる。

※ ここで、に関して、

とし、また、に関して、

とした。

2007-10-25 15:50 nice!(0)
共通テーマ：学問

二項分布と多項分布の比較：ベイズ統計量　 [ベイズ統計量におけるパラメーターの推定]

二項分布と多項分布の比較：ベイズ統計量

Bayes統計量による p の推定量の平均自乗誤差を計算すると
パラメータが既知のBayes統計量の平均自乗誤差は、

パラメータが未知のBayes統計量の平均自乗誤差は、

ここで、二項分布と多項分布の比較をしてみると、
I. モーメント法による推定量について

となり、二項分布の場合と一致する。

II. パラメータが既知のベイズ統計量について

となり、二項分布の場合と一致する。

III. パラメータが未知の場合のベイズ統計量について

となり、二項分布の場合と一致する。

式の導出の計算は、省略したが、たぶん合っていると思います。ｗ
間違っていたら、教えてください。(´д｀)

2007-10-21 12:49 nice!(0)
共通テーマ：学問

モーメント法による推定量　 [ベイズ統計量におけるパラメーターの推定]

モーメント法による推定量

は無作為標本で、k 個の未知な母数を持つ分布に従うものとする。

このとき、

とおくと、は、n が大きくなるとに近づく。

そこで、に関する連立方程式を考える。

この方程式の解をモーメント法によるの推定値という。

モーメント法を用い、p の推定量は、

となる。

2007-10-02 12:07 nice!(0)
共通テーマ：学問

パラメータが未知の場合のベイズ統計量：ベータ分布から多項分布へ　 [ベイズ統計量におけるパラメーターの推定]

パラメータが未知の場合のベイズ統計量：ベータ分布から多項分布へ

朝、出勤して、ミーティング中に
お誕生日、おめでとうケーキが用意されていました。(@_@;
ケーキでは、モンブランが好きです！(・∀・)
みなさま、ありがとうございました。

さて、パラメータが未知の場合、ベータ分布から多項分布への拡張なのだが、
http://blog.so-net.ne.jp/Minky/archive/20070912

今、を推定するために、新たに多項分布からの独立な確率変数として、を抽出する。
ここで、をDirichlet分布とする。

ここで、モーメント法による推定量は、

となる。

今、という条件をつけると、

ゆえに、が未知の Empirical Bayes 統計量は、

として、

となる。
ただし、とする。

2007-09-28 16:33 nice!(0)
共通テーマ：学問

パラメータが既知の場合のベイズ統計量：ベータ分布から多項分布へ　 [ベイズ統計量におけるパラメーターの推定]

パラメータが既知の場合のベイズ統計量：ベータ分布から多項分布へ

以前に、ベータ分布のパラメータが既知の場合のベイズ統計量を考えたことがあるが
http://blog.so-net.ne.jp/Minky/2007-09-07
今度は、ベータ分布から多項分布へ拡張した場合にどうなるかを考える。

をパラメータが未知な値を持つ多項分布からの独立な確率変数とし、W の事前分布として Dirichlet分布を仮定する。W の事前確率密度関数 ξ は、

である。Wの事後分布密度関数は、のとき、

であるので、

ゆえに、上式は、パラメータを持つ Dirichlet分布となる。

Dirichletの p の期待値は、
（Prior Mean）

（Posterior Mean）

となる。

となる。
ただし、とする。

2007-09-26 15:40 nice!(0)
共通テーマ：学問

多項分布とDirichlet分布　 [ベイズ統計量におけるパラメーターの推定]

多項分布とDirichlet分布

多項分布とDirichlet分布の関係は、二項分布とベータ分布の関係に似ている。
二項分布を多次元に拡張した場合、次元を n 次元にした場合を考える。

前回同様に、パラメータが既知の場合のベイズ統計量と、パラメータが未知の場合のベイズ統計量を計算したいと思うが、まずは、分布の復習から。

★ 多項分布とは
1回の回の試行で互いに排反な事象の起こる確率がそれぞれ

とし、この試行を N 回独立に繰り返すときの起こる確率をそれぞれとする。
また、としたとき、その確率密度分布は、

となって、平均、分散、共分散は、

となる。

★ Dirichlet分布とは
ベータ分布の多次元化としてして、Dirichlet分布を考える。
をパラメーターを持つ確率変数とすると、その確率密度関数は、

となる。ここでは、ガンマ関数を表す。平均、分散、共分散は、

2007-09-25 20:21 nice!(0)
共通テーマ：学問

サンプル数が多い場合の精度比較　 [ベイズ統計量におけるパラメーターの推定]

サンプル数が多い場合の精度比較

標本数が多い場合

について、

II.

III.

の漸近分布を考える。

I.について

n が大きい場合は、中心極限定理より、
平均 0、分散 p(1 - p) の正規分布 N(0, p(1 - p)) になる。

II.について

n が大きい場合は、中心極限定理より、
平均 0、分散 p(1 - p) の正規分布 N(0, p(1 - p)) になる。

III.について

n が大きい場合は、中心極限定理より、
平均 0、分散 p(1 - p) の正規分布 N(0, p(1 - p)) になる。

ということで、前回の予想通り、I, II, IIIは、サンプル数が多くなるとどれも同じ分布に収束する。

2007-09-18 11:21 nice!(0)
共通テーマ：学問

リスクの評価　 [ベイズ統計量におけるパラメーターの推定]

リスクの評価

今まで、考えた統計量は、
I.モーメント法によるの推定量の平均自乗誤差
II.パラメータが既知のベイズ統計量の平均自乗誤差
III. パラメータが未知のベイズ統計量の平均自乗誤差

それぞれの統計量に対し統計量との平均自乗誤差を考える。

I.モーメント法によるの推定量の平均自乗誤差

さらに期待値を取ると

II.パラメータが既知のベイズ統計量の平均自乗誤差

さらに期待値を取ると

III. パラメータが未知のベイズ統計量の平均自乗誤差

さらに期待値を取ると

予想として、I、II、IIIは、サンプル数が多くなるとどれも同じ分布に収束するだろう。
サンプル数が小さいときは、上記のように個々に分布を考える必要がある。

2007-09-17 23:54 nice!(0)
共通テーマ：学問

パラメータが未知の場合のベイズ統計量　 [ベイズ統計量におけるパラメーターの推定]

パラメータが未知の場合のベイズ統計量は、

と置くことができる。

問題は、α, βをどのようにして推定するか？

新たに、

をベルヌーイ分布からの独立な確率変数を抽出する。
各はベータ分布とする。

推定する方法は色々あるだろうが、モーメント法による推定量を考える。

は無作為標本で、k個の未知な母数

を持つ分布に従うものとする。

は、n が大きくなると

に近づく。

のモーメント法による推定量は、

より

つまり、

(1次のモーメント)

これで、2次のモーメントを求めることができれば、連立方程式を解くことにより、

を求めることができるのだが、の1次のモーメントも2次のモーメントも

(1次のモーメント)

(2次のモーメント)

となって、一般に、の n次のモーメントも

となるので、

をモーメント法では、同時に推定することはできない。

例えば、ここで

という条件をいれると、

α, βが未知の場合のベイズ統計量は、

と求めることができる。

2007-09-12 11:06 nice!(0)
共通テーマ：学問

パラメータが既知の場合のベイズ統計量　 [ベイズ統計量におけるパラメーターの推定]

Wの事前分布としてベータ分布と仮定する。
ここで、ベータ分布とする理由は、
1) 比較的事後分布を導くことが容易である。
2) α と β の母数の選び方により、分布の形が様々となり、多様な事前分布を表すことができる。
3) 母数α、β の解釈が容易である。

母数α、β の定め方は、どのような事象の生起確率を問題にしているかによって異なる。
まったく事前知識のない事象の生起確率ならば、α = 1、β = 1、すなわち、0≦ p ≦ 1 のどの値も同等に起こりやすいとすることができる。
また、コインを投げる簡単な実験の場合ならば、予想される p のあたいは0.5のまわりに集中する。
あるいは、イカサマコインなどで、表が出やすいという印象を持っているならば、α = 3、β = 2という事前分布が設定できる。
あるいは、事前の知識を無視し、中立的な事前分布を設定することもできる。

に関する連立方程式を考える。

この方程式の解

をモーメント法による

の推定値という。

モーメント法を用い p の推定量は、

となる。

パラメータが既知の場合のベイズ統計量

をパラメータ W が未知な値を持つベルヌーイ分布からの独立な確率変数とし、 W の事前分布としてベータ分布と仮定する。
W の事前確率密度関数 ξ は、

そして、W の事後分布密度関数

は、X = x のとき、

であるので、

ここで、

とする。

この式は、パラメータ α + y と β + n - y を持つベータ分布となっている。

ここでベータ分布の p の期待値は、

であることより、

となる。
今、上の式によって得られたベイズ統計量を

とする。

ここら辺りまでは、引っ張ってくれば色々な文献で見つけることができる。
次の課題としては、パラメータが未知の場合のベイズ統計量の場合。

そもそも、パラメータが未知の場合の方が多いのではないだろうか？

2007-09-07 15:56 nice!(0)
共通テーマ：学問

いくつかの分布その1　[ベイズ統計量におけるパラメーターの推定]

いくつかの分布その1

ベルヌーイ分布
離散型確率変数Xが1と0の2つの値しかとらない分布を考える。
成功を X = 1、失敗を X = 0と表し、成功の確率を p とする。
そのとき、X の分布は、次式によって表される。

重要な仮定は…
毎回の確率事象が同一で、かつ独立であること
コイン投げで考えると、以前に表･裏のどちらがどのように出たかに拘らず、毎回の表･裏の出る確率が同じ決まった値になっていることである。

二項分布
n 回のベルヌーイ試行が、成功の確率pが変化することなく、互いに独立に行われるとする。
個々の結果が生起する確率は、成功が x 回、失敗が ( n - x) 回であれば、

で表される。今、成功の回数を確率変数 X としてその分布を求めてみる。
成功の回数が x 回の標本点は

とおりあるので、x の分布は、