サンプルサイズが小さい場合、ベイズ的なアプローチでなんとかしたい [データサイエンス、統計モデル]
「サンプルサイズが小さい場合、ベイズ的なアプローチでなんとかなりませんか?」
という質問を受けました。
最近、この手の質問をよく受けるようになりました。。。
ベイズの場合、事前分布を上手く設定すれば、確かにサンプルサイズが小さくても有益な情報を得ることができます。
ただ、事前分布というのが曲者で、サンプルサイズが小さい場合は、そちらの影響を強く受けてしまうという性質もあります。
サンプルサイズが大きくなれば、事前分布の影響はどんどん小さくなっていきます。
つまり、適当な事前分布を設定してしまった場合、誤った結論を得てしまうというリスクも存在します。
基本的には、トレードオフで、通常のアプローチに比べてリスクなどもなく、かつ、小さいサンプルサイズでより良い知見が得られる!となれば、みんなその方法に飛びつくわけです。
プラスの面とマイナスの面を把握した上で、どちらのアプローチを使うかどうかの選択が必要かと思われます。
という質問を受けました。
最近、この手の質問をよく受けるようになりました。。。
ベイズの場合、事前分布を上手く設定すれば、確かにサンプルサイズが小さくても有益な情報を得ることができます。
ただ、事前分布というのが曲者で、サンプルサイズが小さい場合は、そちらの影響を強く受けてしまうという性質もあります。
サンプルサイズが大きくなれば、事前分布の影響はどんどん小さくなっていきます。
つまり、適当な事前分布を設定してしまった場合、誤った結論を得てしまうというリスクも存在します。
基本的には、トレードオフで、通常のアプローチに比べてリスクなどもなく、かつ、小さいサンプルサイズでより良い知見が得られる!となれば、みんなその方法に飛びつくわけです。
プラスの面とマイナスの面を把握した上で、どちらのアプローチを使うかどうかの選択が必要かと思われます。