頻度論とベイズ統計の主な考え方の違い〜最尤法を理解するその2〜：Minkyのよもやま日記：SSブログ

	ブログをはじめるログイン

LinkedInのスキルテスト"R"を受..｜第33期竜王戦1組決勝羽生九段VS.. ブログトップ

頻度論とベイズ統計の主な考え方の違い〜最尤法を理解するその2〜　[データサイエンス、統計モデル] [編集]

頻度論とベイズ統計の主な考え方の違い〜最尤法を理解する〜
https://skellington.blog.ss-blog.jp/2020-04-26
↑
こちらの続きから

# 対数尤度を計算
lhf <- dnorm(sample_dat, a, b)
sum(log(lhf))

このとき、aとbをどう設定するか？です。

適当な数字をどんどん入れていくのは非効率的です。
解析的に求めたい。

aは、平均値
bは、標準偏差
が入ります。

a <- mean(sample_dat)
b <- sd(sample_dat)
として良いか？

実は、これだと対数尤度が最大になりません。
Rの場合、sdは、不偏標準偏差を求める関数となっています。
実際は、得られたデータに対して正規分布を当てはめるため、標本標準偏差を使う必要があります。

標本標準偏差を直接計算する関数はないので、こちらで標本標準偏差を計算。
# 標本分散
b_var <- var(sample_dat)*(length(sample_dat)-1)/length(sample_dat)
# 標本標準偏差
b <- sqrt(b_var)

このa, bを使うと、対数尤度関数が最大となります。

2020-05-08 23:59 nice!(1) コメント(0)
共通テーマ：日記・雑感