確率密度と確率の関係 [データサイエンス、統計モデル]
統計の講師をしていて、なるほど!と思う質問を受けることがあります。
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
正規分布の場合、x=0の確率密度は、0.3989となります。この確率密度は確率のことですか?
【回答】
確率密度は、連続型確率変数で使われる概念となります。
特定の値に対しての確率密度というのはあまり意味がなく、Xがa以上b以下となる確率は、〇〇となるという言い方をして、始めて意味が出てきます。
Xがa以上b以下となる確率を計算する際に、確率密度をaからbまで積分した値を求めるとそれが確率となります。
正規分布の場合は、-∞から0まで積分した値は、0.5(確率)となります。
Rで計算する場合、確率密度はdnorm、確率はpnormで計算できます。
(例)
x=0の確率密度は?
> dnorm(0)
[1] 0.3989423
xが-∞から0となる確率は?
> pnorm(0)
[1] 0.5
せっかくなので、その中からピックアップして紹介できればと思います。
【質問】
正規分布の場合、x=0の確率密度は、0.3989となります。この確率密度は確率のことですか?
【回答】
確率密度は、連続型確率変数で使われる概念となります。
特定の値に対しての確率密度というのはあまり意味がなく、Xがa以上b以下となる確率は、〇〇となるという言い方をして、始めて意味が出てきます。
Xがa以上b以下となる確率を計算する際に、確率密度をaからbまで積分した値を求めるとそれが確率となります。
正規分布の場合は、-∞から0まで積分した値は、0.5(確率)となります。
Rで計算する場合、確率密度はdnorm、確率はpnormで計算できます。
(例)
x=0の確率密度は?
> dnorm(0)
[1] 0.3989423
xが-∞から0となる確率は?
> pnorm(0)
[1] 0.5