SSブログ

頻度論とベイズ統計の主な考え方の違い 〜最尤法を理解する その2〜 [データサイエンス、統計モデル]

頻度論とベイズ統計の主な考え方の違い 〜最尤法を理解する〜
https://skellington.blog.ss-blog.jp/2020-04-26

こちらの続きから

# 対数尤度を計算
lhf <- dnorm(sample_dat, a, b)
sum(log(lhf))

このとき、aとbをどう設定するか?です。

適当な数字をどんどん入れていくのは非効率的です。
解析的に求めたい。

aは、平均値
bは、標準偏差
が入ります。

a <- mean(sample_dat)
b <- sd(sample_dat)
として良いか?

実は、これだと対数尤度が最大になりません。
Rの場合、sdは、不偏標準偏差を求める関数となっています。
実際は、得られたデータに対して正規分布を当てはめるため、標本標準偏差を使う必要があります。

標本標準偏差を直接計算する関数はないので、こちらで標本標準偏差を計算。
# 標本分散
b_var <- var(sample_dat)*(length(sample_dat)-1)/length(sample_dat)
# 標本標準偏差
b <- sqrt(b_var)

このa, bを使うと、対数尤度関数が最大となります。

nice!(1)  コメント(0) 
共通テーマ:日記・雑感

nice! 1

コメント 0