頻度論とベイズ統計の主な考え方の違い 〜最尤法を理解する その2〜 [データサイエンス、統計モデル]
頻度論とベイズ統計の主な考え方の違い 〜最尤法を理解する〜
https://skellington.blog.ss-blog.jp/2020-04-26
↑
こちらの続きから
# 対数尤度を計算
lhf <- dnorm(sample_dat, a, b)
sum(log(lhf))
このとき、aとbをどう設定するか?です。
適当な数字をどんどん入れていくのは非効率的です。
解析的に求めたい。
aは、平均値
bは、標準偏差
が入ります。
a <- mean(sample_dat)
b <- sd(sample_dat)
として良いか?
実は、これだと対数尤度が最大になりません。
Rの場合、sdは、不偏標準偏差を求める関数となっています。
実際は、得られたデータに対して正規分布を当てはめるため、標本標準偏差を使う必要があります。
標本標準偏差を直接計算する関数はないので、こちらで標本標準偏差を計算。
# 標本分散
b_var <- var(sample_dat)*(length(sample_dat)-1)/length(sample_dat)
# 標本標準偏差
b <- sqrt(b_var)
このa, bを使うと、対数尤度関数が最大となります。
https://skellington.blog.ss-blog.jp/2020-04-26
↑
こちらの続きから
# 対数尤度を計算
lhf <- dnorm(sample_dat, a, b)
sum(log(lhf))
このとき、aとbをどう設定するか?です。
適当な数字をどんどん入れていくのは非効率的です。
解析的に求めたい。
aは、平均値
bは、標準偏差
が入ります。
a <- mean(sample_dat)
b <- sd(sample_dat)
として良いか?
実は、これだと対数尤度が最大になりません。
Rの場合、sdは、不偏標準偏差を求める関数となっています。
実際は、得られたデータに対して正規分布を当てはめるため、標本標準偏差を使う必要があります。
標本標準偏差を直接計算する関数はないので、こちらで標本標準偏差を計算。
# 標本分散
b_var <- var(sample_dat)*(length(sample_dat)-1)/length(sample_dat)
# 標本標準偏差
b <- sqrt(b_var)
このa, bを使うと、対数尤度関数が最大となります。
コメント 0